
2026 年齊到 2 月了,你如果還沒傳奇過 Agentic AI,大要率不單是斷網這樣簡便——更像是手機齊丟了。
我我方算是從新看著這波海潮起來的。OpenClaw(那時還叫 ClawdBot)火出圈那陣子,好多東談主第一次真確「看懂」了一件事:咱們瞎想中的 AI Agent 時期,關節從來不在它能不可聊得更像東談主,而在它能不可把事辦完。
它能開瀏覽器、能點按鈕、能把一個原來需要你反復切 App 的任務拆成步調,一齊推行到掃尾。你致使會在某個須臾產生錯覺:屏幕那頭像的確坐著一個很持重的實習助理。
與此同期,自動化操作這股風,早就吹得手機上了。無論是豆包手機這類軟硬件模式,照舊各家手機大廠在系統助手上的「行動化」嘗試,內容上齊在作念并吞件事——把 AI 從對話框里拽出來,塞進系統和 App 的縫里,讓它去完成那些「明明很簡便但等于很煩」的操作鏈路:打車、下單咖啡、生成文檔。
但是,單純的云側智能或單純的端側推行,齊有著各自難以杰出的「天花板」。
云側的 OpenClaw 領有雄偉的推明智力,但它看不見你手機當下的屏幕,不知談你此刻的地輿位置,更不敢徑直操作你土產貨的微信去發個紅包;而市面上常見的純端側助手,誠然能調用土產貨的數據和應用,卻通常因為硬件算力松手,在面對高復雜、長經由任務時顯得「才略不夠用」。
遷徙端 AI Agent 的贏輸手,早就不是「作念云照舊作念端」的遴選題,而是怎樣把兩者的上風真確買通。近期,一家清華系團隊「萬象智維」遴選用「小萬」切入阛阓,押注的恰是這樣一套買通端云的智力體系: 讓云表作念「大腦」,講求復雜邏輯與計劃;讓端側作念「當作」,講求感知與臨了一公里推行。
? 01不僅是「能最先」,
更是「單干明確」
?在 AI Agent 的應用場景中,開采的定位互異永久是制約體驗升級的關節。電腦與云處事器是天生的后果器用,憑借 7×24 小時不時交啟動的上風,擅長承載復雜計較與耐久推行類任務。而手機則是中樞糊口器用,千里淀著最細碎、最個東談主化的行為民風和凹凸文數據。
傳統的念念路是:要么把所少見據傳上云,但這瀕臨陰私和蔓延的挑戰;要么在端側硬跑大模子,但這會燒穿手機的電板和算力。
「萬象智維」的解法是 「端側 GUI + 云側 CLI」 的本事單干。
在「小萬」的居品架構中,手機被定位為 凹凸文的主要進口與推行結尾 。它自然知談你是誰、你咫尺在什么時辰和場地、你正在用哪些應用。而云表的 OpenClaw 則發達其復雜推理與多任務頤養智力,講求耐久啟動任務、系統級 API 操作等中樞使命。
咱們不錯通過兩個實在的場景,來望望這種「端云協同」是怎樣比單一端側更聰惠的:
場景一:復短文檔的「端-云-端」勤勉
當你收到一份幾十頁的本事文檔時,單純的端側模子通常讀不懂深層邏輯,而單純的云表模子又無法徑直操作你的土產貨 App。
在「小萬」的經由里, 端側 Agent 最初接管,期騙土產貨算力索求文檔的關節信息;隨后,任務流轉至 云表 ,由 OpenClaw 進行深度的邏輯梳理和摘錄生成——這是手機土產貨算力難以企及的。臨了,處理好的論斷回傳至手機,由 端側 Agent 再次接辦,盤考你是否需要「發送給共事」或「保存到札記」,并徑直調用微信完成發送。
用戶感知到的是一次清楚的處事,但后臺其實發生了兩次「端-云-端」的職能叮嚀。
場景二:基于感知的智能通勤
朝晨醒來, 端側 Agent 基于土產貨傳感器感知到「外面下雨了」,并讀取了你土產貨日程中「朝晨 9 點有會」的信息。
這些凹凸文被脫敏后發送給 云表 ,云表大腦飛快計劃出一條躲閃擁擠的打車決策,并決策出「需要提前啟程」。
當決策篤定后,領導回到 端側 。此時,「小萬」徑直在手機土產貨喚起打車 App,自動填寫標的地、遴選車型,并停在支付證實頁面恭候你點擊。
這種「端側感知、云側決策、端側推行」的高效協同模式,既隱匿了純端側智能智力不及的短板,也懲處了純云表智能枯竭場景感知和陰私操心的痛點。
{jz:field.toptypename/} ? 02真確懲處的難點:
算力、成本與陰私
?從 Demo 走向實用,一定會遭受一堆硬問題。先說最履行的: 成本與后果 。
把智能體裝進手機聽起來很容易,但現成決策沒法徑直照搬。高頻調用的正常場景里,Token 成本繞不外去;手機端還要算澄瑩內存、功耗、溫度、蔓延。你不錯在云表把模子堆得很大,手機端必須把每一次 Token、每一次訪存、每一次頤養齊算昭著。
哪怕是 OpenClaw,也會豪恣耗盡大模子處事的 Tokens。不少網友在酬酢媒體吐槽賬單太夸張,時時彩app官方下載好多專科用戶一天就能跑出數百好意思元。如果讓手機里的每一個小動作齊去問一遍云表大模子,這在營業上是跑欠亨的。
「萬象智維」給出的旅途,是算法與系統的深度協同優化,重心作念了兩件關節本事使命。
最初,是對端側推理框架的「極限壓榨」。
既然是協同,端側就不可太弱。「萬象智維」開發了一套名為「OmniInfer-VLM」的框架,旨在榨干手機 NPU 的性能。數據露出,在不舍棄精度的前提下,該框架能讓多模態推理速率相對傳統 CPU 決策援手接近 20 倍。
這意味著,像屏幕識別、OCR 索求、簡便的意圖判斷這些高頻操作,實足不錯在土產貨毫秒級完成,無需聯網,既快又省。
在此之上,所以「行為」為中樞的牽記系統。
并不是所有任務齊需要「念念考」。履行中,咱們每天的點咖啡、打卡旅途是高度重疊的。每次齊從零推理不僅慢,也更容易出錯。
團隊引入了一套牽記系統,將用戶的高頻操作旅途空洞成數學模子記載在土產貨。當你第十次點并吞種咖啡時,系統不再需要云表的大腦再行推理「何如點」,而是徑直調用土產貨的行為牽記,進行自動化推行。
這不僅讓推行速率更快,更貧窮的是,它大幅減少了對騰貴云表算力的調用次數——據測算,這種機制能讓平均推理蔓延鐫汰約 1.49 倍。
此外,還有陰私的「護城河」。
在 Agent 時期,陰私不僅是數據,更是行為。比擬于部分決策將每一幀截屏齊上傳云表進行分析,端云協同架構提供了一種折衷的安全性:敏銳的凹凸文(如微信聊天記載、支付密碼頁面)永久保留在端側處理;只好經過脫敏、任務需要的空洞領導才會發往云表。這誠然無法作念到 100% 的物理遠離,但比擬純云表接管,它在架構上為用戶保留了數據的「所有權」。
落地與生態:
清華系團隊的工程化答卷
?AI 硬件需要的是一種低算力、但在高頻場景下仍然鼓脹順的懲處決策。想走到正常使用,總要面對一個履行:算力不可能無窮,體驗卻必須夠穩。
咫尺,這套決策也曾不單是停留在 PPT 上。字據居品信息,「小萬」咫尺已完畢了端側抓久化的凹凸文牽記,在實足依靠端側本身算力相助云表頤養的條目下,復古約 40 款主流應用,脫色約 150 個場景任務。無論是打車、消費、支付等正常任務,照舊計劃聯系日程,齊不錯通過「小萬」來完成。
這組數字誠然不可等同于「萬能 Agent」,但卻勾勒了一張澄瑩的工程化道路圖:先把高頻、可考證的任務作念塌實,再把脫色面鋪開。
而在部署上,「萬象智維」通常把「土產貨化」當成中樞智力籌商:「小萬」的端側任務主要期騙手機土產貨算力完成;云側會為每位用戶開設零丁的編造云處事。對有土產貨部署需求的企業用戶,他們還提供了土產貨化部署 OpenClaw 的決策,通過 API 無縫接入「小萬」,進一步鐫汰陰私操心。
這套鍛真金不怕火的工程化打法背后,是豐足的本事積蓄。「萬象智維」依托清華大學端智能聯系團隊孵化誕生,中樞團隊在清華大學計較機系任炬副素質與清華大學智能產業聯系院李元春助理素質的耐久領導下,在端側模子輕量化與高效推理界限有著塌實積蓄。公司誕生后首輪融資便得回歸自星連老本事投的數千萬元天神輪投資,也側面印證了行業對其本事道路的認同。
? 04以前:從東談主機交互到
Agent-to-Agent
?如果說 OpenClaw 讓咱們看到「Agent 不錯最先」的可能性,那么「小萬」更像在講述另一個問題:當最先發生在更多模式的端側開采上,智能體還能不可把事辦完,而且辦得讓東談主定心?
以前的端側 AI,無意不會局限在手機這一個模式上。眼鏡、腕表、致使是以前的新式結尾,它們內容上齊是一個個「端側 Agent」。它們各自領有不同的傳感器和推行智力(有的能看,有的能跑),而云表則是一個通用的「超等大腦」。
「萬象智維」正在構建的,恰是糾合這兩者的中間層—— Agent-to-Agent 的交互網羅 。
在這套網羅中,任務不再被綁定在某一臺開采上,而是由云表融合計劃,分發給最得當的端側開采去推行。遷徙端 AI 的「最先時期」也曾開場。真確的分水嶺,無意不在于誰的模子參數更大,而在于誰能用最工程化的技巧,把聰惠(云)和靠譜(端)真確聯結在一齊,懲處那些用戶每天齊要作念、又最怕出錯的瑣事。

備案號: