訂閱
糾錯(cuò)
加入自媒體

面壁打響“端側(cè)智能體”第一槍,國(guó)產(chǎn)大模型五虎各走各路了

2025-04-01 09:03
雷科技
關(guān)注

把模型送去上班,就是 Agent。

如果你最近關(guān)注 AI 圈,幾乎很難繞開「智能體(Agent)」這個(gè)詞。在能夠獨(dú)立建站、做股票分析、安排旅行日程的 Manus AI 智能體大火之后,國(guó)內(nèi)外更多公司開始公開押注「AI 智能體」。

甲骨文 AI 集團(tuán)副總裁 Miranda Nash 在接受采訪時(shí)表示,AI Agent(智能體)將成為今年科技公司的關(guān)注焦點(diǎn)。智譜 CEO 張鵬在最近舉行的 2025 中關(guān)村論壇年會(huì)上發(fā)布了全新智能體 AutoGLM 沉思,并表示 2025 年會(huì)是 AI Agent(智能體)的爆發(fā)之年。

不只是智譜和 AutoGLM 沉思,2025 中關(guān)村論壇年會(huì)上,這股智能體浪潮還有一個(gè)標(biāo)志性落點(diǎn)——面壁智能正式發(fā)布「小鋼炮超級(jí)助手 cpmGO」,號(hào)稱是全球首個(gè)落地車端的純端側(cè)智能助手,也是面壁智能「模型即 Agent」愿景的一次技術(shù)實(shí)踐。

beb8e84e8f39b24d3abd8eed2180d7b5.jpg

圖/面壁智能

特別在于,這個(gè)小體積的智能助手并不跑在云上,而是完全部署在汽車設(shè)備上,能在斷網(wǎng)、弱網(wǎng)環(huán)境下自主完成感知、理解、決策與執(zhí)行的全過程。不同于我們熟悉的語(yǔ)音助手,面壁智能宣稱「小鋼炮」能看、能聽、能說,也能動(dòng)手幫你控車、看屏、識(shí)人、識(shí)艙、甚至值班守車。

而作為 2022 年成立的國(guó)產(chǎn)大模型初創(chuàng)企業(yè),面壁智能一直是將「高效大模型」「端側(cè)部署」作為自身的技術(shù)主線,旗下 MiniCPM 系列模型目前已經(jīng)應(yīng)用于 AI 手機(jī)、AI PC、智能座艙等多個(gè)終端形態(tài)。

在這次中關(guān)村論壇上,面壁智能聯(lián)合創(chuàng)始人兼 CEO 李大海還引用了知名 AI 工程師、Pleias 聯(lián)合創(chuàng)始人 Alexander Doria 的話表示,模型本身而非工作流,才是未來 AI 智能體的發(fā)展方向——模型即智能體,模型即產(chǎn)品,模型即交互:

「把小鋼炮這個(gè)端側(cè)模型送去上班,就是 Agent。」

427.jpg

面壁智能聯(lián)合創(chuàng)始人兼 CEO 李大海,圖/中關(guān)村論壇

李大海還透露,小鋼炮助手將于今年 Q3 正式隨車上市,一些整車廠和 Tier1 廠商已經(jīng)在開展測(cè)試。在這場(chǎng)智能體競(jìng)賽中,面壁用一個(gè)能「上車」的 AI 智能體,率先打響了國(guó)產(chǎn)端側(cè)智能體的第一槍。

面壁「小鋼炮」上車,不只是語(yǔ)音助手

比起只會(huì)聽你說「打開空調(diào)」的傳統(tǒng)車載語(yǔ)音助手,小鋼炮超級(jí)助手 cpmGO 顯然要復(fù)雜得多。

作為一款部署在車端的純端側(cè)模型和超級(jí)助手,「小鋼炮」不依賴云端推理,而是由面壁智能自研的 MiniCPM-o 全模態(tài)模型本地運(yùn)行完成,從「感知 → 理解 → 推理 → 調(diào)用工具 → 實(shí)際執(zhí)行」形成完整的智能體閉環(huán)。

首先能「看」。基于艙內(nèi)外攝像頭,「小鋼炮」能識(shí)別乘客手勢(shì)、面部、車外動(dòng)態(tài)等視覺信息,結(jié)合麥克風(fēng)陣列進(jìn)行語(yǔ)音感知,構(gòu)建起強(qiáng)大的多模態(tài)感知系統(tǒng)。你抬個(gè)手、回個(gè)頭,它就能做出響應(yīng)。

「小鋼炮」還能「理解」和「決策」,不僅能識(shí)別指令意圖,還能理解上下文。比如當(dāng)你對(duì)著中控屏問「這個(gè)怎么調(diào)亮一點(diǎn)」,它能理解「這個(gè)」指的是屏幕亮度,并跳轉(zhuǎn)到對(duì)應(yīng)界面,執(zhí)行調(diào)整操作。

93e867ea1a32e4f0d343f8dcdcdb7045.jpg

圖/面壁智能

這里值得一提的是,面壁在去年 12 月就打造出了首個(gè)純端側(cè)部署、Always On 的「GUI Agent 屏幕助手」,所以不僅能看、能說,還能干,在屏幕上實(shí)現(xiàn)「可見即可說」。在此基礎(chǔ)上,「小鋼炮」具備一定程度上的「工具調(diào)用能力」,不僅可以實(shí)現(xiàn)泛化語(yǔ)音車控、智能哨兵、兒童與寵物監(jiān)控,也能直接在車機(jī)或者手機(jī)屏幕上自動(dòng)完成一連串的操作任務(wù)。

尤其是在車端場(chǎng)景,可以避免手指觸屏,直接通過語(yǔ)音指揮導(dǎo)航,甚至讓小鋼炮拍照并分享給朋友。更重要的是,這一切在弱網(wǎng)、甚至無網(wǎng)的環(huán)境下都可運(yùn)行,真正滿足端側(cè)智能體對(duì)低延遲、強(qiáng)隱私的剛性要求。

但「小鋼炮」更大的意義,在于它已經(jīng)具備「智能體」的核心三要素:自主感知、意圖判斷、工具調(diào)用。它不是預(yù)設(shè)任務(wù)的腳本執(zhí)行器,而是一個(gè)能夠理解用戶語(yǔ)境、做出合理判斷并完成任務(wù)的智能體和 AI 助手——當(dāng)然,目前這個(gè)「助手」可能仍偏向執(zhí)行型,而非規(guī)劃型。

至少?gòu)哪壳傲鞒龅男畔⒑脱菔緛砜矗姹诘摹感′撆凇鼓芨苫,但還不太會(huì)「主動(dòng)安排工作」,也缺少作為「虛擬駕駛助理」的人格化設(shè)定與情緒表達(dá),同時(shí)大量場(chǎng)景還未廣泛上市驗(yàn)證。另外,李大海雖然也在演進(jìn)中提到了當(dāng)前 Agent 智能體的一大通病是「長(zhǎng)期上下文記憶差」,但「小鋼炮」目前也并未展現(xiàn)出解決這個(gè)挑戰(zhàn)的表現(xiàn)和能力。

e7cbdb353a2003d05baf7c51670295dd-1.jpg

圖/面壁智能

也就是說,面壁用「小鋼炮」解決了智能體能不能「本地跑」、能不能「穩(wěn)定干活」的問題,但智能體夠不夠「聰明」、能不能「持續(xù)成長(zhǎng)」的問題,可能還有待驗(yàn)證和探索。

五大國(guó)內(nèi)初創(chuàng)大模型公司,不同的路線走法

如果說 Manus 掀起了新一輪「智能體」的討論熱潮,那么在國(guó)內(nèi)大模型初創(chuàng)公司中,誰(shuí)在真正推動(dòng)智能體落地?誰(shuí)又在各走各的路?

目前來看,面壁智能、智譜、百川智能、月之暗面(Kimi)和深度求索(DeepSeek)這五家國(guó)產(chǎn)代表性的大模型初創(chuàng)公司,已經(jīng)逐步顯露出各自明確而獨(dú)特的路線分野。

面壁智能:All in 端側(cè),一步到崗

4954a85da528d4fabcbc964fd29174a2.png

圖/面壁智能

面壁的戰(zhàn)略關(guān)鍵詞可以總結(jié)為三點(diǎn):「輕量模型、純端部署、場(chǎng)景落地」。MiniCPM 系列的定位從一開始就不是對(duì)標(biāo)云端大模型,而是追求能在 AI 手機(jī)、汽車、AI PC 等終端本地跑起來、干活不掉鏈子的小模型。

相比多數(shù)同行還在「智能體是什么」階段做演示、發(fā)論文,面壁已經(jīng)算是把「智能體」落地走得比較快的廠商,至少已經(jīng)部署到了汽車上,支持 real-time、多模態(tài)、無網(wǎng)絡(luò)運(yùn)行,真正進(jìn)入了真實(shí)的使用場(chǎng)景之中。

但這也意味著它必須面對(duì)工程難題、芯片適配、商業(yè)驗(yàn)證等「重活」,路徑并不輕松。

智譜 AI:技術(shù)中臺(tái)派,B 端+模型生態(tài)

FnyPDfB5qI.png_副本.jpg

圖/智譜

作為成立最早的大模型公司之一,智譜走的是大模型中臺(tái) + 企業(yè)服務(wù)路線,強(qiáng)調(diào)從預(yù)訓(xùn)練模型、到行業(yè)數(shù)據(jù)集、再到垂直應(yīng)用的全鏈條能力。智能體方面,智譜目前也更強(qiáng)調(diào)「從大模型能力中長(zhǎng)出智能體」,更注重通用性與生態(tài)的建設(shè)。

與此同時(shí),智譜還是國(guó)內(nèi)最早一批走到「智能體」這一步的廠商,陸續(xù)推出了 GLM- PC 智能體、AutoGLM (手機(jī))智能體以及最新的 AutoGLM 沉思智能體。其中 AutoGLM 沉思的使用場(chǎng)景與此前大火的 Manus 類似,可以進(jìn)行行業(yè)研究、購(gòu)物推薦、教案/教程制作、旅行攻略等。

不同的是,AutoGLM 沉思的背后,是智譜自研的全棧大模型技術(shù),融合了 GLM-4 的通用能力、GLM-Z1 的反思能力、GLM-Z1-Rumination 的沉思能力,以及 AutoGLM 的自動(dòng)執(zhí)行能力。

百川智能:商業(yè)應(yīng)用導(dǎo)向,All in 醫(yī)療大模型

8c1e-7720e7762103261f7a8d6350d88cd8e1.png

圖/百川智能

搜狗創(chuàng)始人王小川創(chuàng)立的百川智能動(dòng)作迅速,但方向選擇更為聚焦。從早期通用 Baichuan 系列大模型切入,再快速向垂類商業(yè)化場(chǎng)景推進(jìn),甚至對(duì)外表示 All in 醫(yī)療,打造醫(yī)療大模型和智能體。

與面壁不同的是,百川走的是「模型+知識(shí)圖譜+行業(yè)專家系統(tǒng)」的組合路線,更注重服務(wù)能力的定制性。簡(jiǎn)單來說,智能體對(duì)它來說更像是「垂直領(lǐng)域的執(zhí)行引擎」,而不是通用平臺(tái)。

月之暗面(Kimi):模型即服務(wù),做好 C 端助手

frc-2b4070c24b0ba419d490a1b887140fe5.jpg

圖/月之暗面

相比另外幾家,月之暗面走了一條完全不同的路線,幾乎將全部精力集中在「模型即服務(wù)」上,專注從大模型到 C 端產(chǎn)品——Kimi 的垂直整合和用戶體驗(yàn)的打磨。

盡管目前月之暗面還沒有推出真正意義上的智能體,但相信這件事已經(jīng)在路上了。從根本上,月之暗面想做的 AI 智能助手很難只靠?jī)?yōu)秀的對(duì)話能力支撐,能夠?qū)W習(xí)和代替人類完成任務(wù)的智能體,應(yīng)該說是題中應(yīng)有之義。

另一方面,打造智能體的難點(diǎn)在于推理能力、記憶能力以及工具調(diào)用能力,推理是當(dāng)下包括月之暗面在內(nèi)所有大模型廠商的大勢(shì)所趨,而記憶(長(zhǎng)上下文)則是 Kimi 主打的優(yōu)勢(shì)之一。可以說,Kimi 唯一比較欠缺的就是工具調(diào)用能力,但這也是業(yè)界共同面對(duì)的挑戰(zhàn)。

DeepSeek:用開源大模型,驅(qū)動(dòng)智能體爆發(fā)

Deepseek-r1-logo_副本.jpg

圖/ DeepSeek

嚴(yán)格來說,DeepSeek 并沒有推出自己的智能體,但并不妨礙今天 DeepSeek 在智能體領(lǐng)域舉足輕重的地位。尤其是開源的 DeepSeek R1 憑借相對(duì)較低的成本和相對(duì)較高的推理思考能力,幾乎是目前打造智能體最受歡迎的「底座模型」。

從戰(zhàn)略上看,DeepSeek 其實(shí)也不急于推出自己的智能體產(chǎn)品。從 DeepSeek 目前的動(dòng)作來看,他們現(xiàn)階段還是更專注在大模型的效率與推理能力上持續(xù)優(yōu)化,打造「可負(fù)擔(dān)、可定制、可擴(kuò)展」的底層能力平臺(tái)。

最好的例子就是大模型初創(chuàng)公司零一萬(wàn)物在戰(zhàn)略轉(zhuǎn)型后,決定基于 DeepSeek(內(nèi)核)打造 AI 時(shí)代的 Windows(系統(tǒng))。事實(shí)上,包括 Manus 在內(nèi)不少智能體就是基于 DeepSeek 或者 Claude 等基座大模型進(jìn)行打造。

抬頭看,面壁智能的選擇是不是條好路?

從橫向?qū)Ρ葋砜,面壁是五家中唯一一個(gè)將純端側(cè)智能體部署到端側(cè)實(shí)體設(shè)備、并形成閉環(huán)交互的公司。

但對(duì)面壁來說,「All in 端側(cè)」可能并非一個(gè)短期營(yíng)銷標(biāo)簽,而是一條被選定之后就幾乎沒有回頭路的技術(shù)路徑。這條路徑的好處很清楚:更強(qiáng)的隱私保護(hù)、更低的延遲、更高的部署靈活性,也更貼近智能手機(jī)、汽車等終端設(shè)備的算力現(xiàn)實(shí)。

不過它的難點(diǎn)也同樣清楚——模型必須更輕、更穩(wěn)、更準(zhǔn),還得更懂「干活」,最關(guān)鍵的是要面對(duì)端側(cè)算力受限的問題,通過智能體來完成復(fù)雜任務(wù)。所以我們看到,面壁智能在強(qiáng)調(diào)自己的工程能力:

MiniCPM 輕量高效、GUI Agent 屏幕助手落地、cpmGO 可在車內(nèi)無網(wǎng)運(yùn)行、執(zhí)行全鏈條任務(wù)。

可部署不是終點(diǎn)。智能體能不能處理任務(wù)鏈條中的變量?能不能隨著用戶習(xí)慣變化而成長(zhǎng)?這些都是智能體要獨(dú)立完成的挑戰(zhàn),更不要說是純端側(cè)的智能體。更現(xiàn)實(shí)的問題在于——體驗(yàn)如何?這是需要面壁來回答的。

來源:雷科技

       原文標(biāo)題 : 面壁打響“端側(cè)智能體”第一槍,國(guó)產(chǎn)大模型五虎各走各路了

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)