文/王慧瑩 編輯/子夜 什么是更接近AGI的形態(tài),是能用腦子思考的大模型" />
訂閱
糾錯(cuò)
加入自媒體

競(jìng)逐AI Agent時(shí)代

圖片

文/王慧瑩

編輯/子夜

什么是更接近AGI的形態(tài),是能用腦子思考的大模型,還是能用行動(dòng)互動(dòng)的Agent?

隨著技術(shù)不斷進(jìn)步,應(yīng)用不斷落地,人與機(jī)器的互動(dòng)方式正在發(fā)生范式轉(zhuǎn)變,這個(gè)答案成了兩者的結(jié)合——AI Agent。

AI Agent,又被稱作是AI智能體,即一種能通過(guò)對(duì)環(huán)境的感知,進(jìn)行思考決策并執(zhí)行的智能體。與GPT等應(yīng)用相比,AI Agent在思考與行動(dòng)方式上和人類很相似,是人工智能機(jī)器人的初級(jí)形態(tài)。

在過(guò)去三年中,大模型在自然語(yǔ)言處理、圖像生成等領(lǐng)域展現(xiàn)出驚人能力,但隨著參數(shù)規(guī)模突破千億級(jí),技術(shù)邊際效益遞減的魔咒開(kāi)始顯現(xiàn):模型理解能力停留在表層語(yǔ)義,復(fù)雜任務(wù)執(zhí)行依賴人工指令拆解,應(yīng)用落地陷入 "玩具化" 困境。

更重要的是,用戶對(duì)AI的期待早已超越簡(jiǎn)單問(wèn)答,他們需要一個(gè)能主動(dòng)思考的助手,這種供需錯(cuò)位給了AI Agent爆發(fā)的機(jī)會(huì)。AI Agent就像一個(gè)能感知、能理解、能行動(dòng)的AI助手。

圖片

尤其是伴隨大模型應(yīng)用元年的到來(lái),技術(shù)落地是個(gè)備受關(guān)注的問(wèn)題,AI Agent被很多人看作是這輪AI技術(shù)落地的最終范式。

去年,市場(chǎng)研究機(jī)構(gòu)Research and Market發(fā)布的報(bào)告中指出,未來(lái)五年AI智能體的市場(chǎng)規(guī)模將增加420億美元。麥肯錫也表示,AI智能體將是生成式AI的下一個(gè)前沿。

進(jìn)入2025年,從OpenAI的Operator到中國(guó)AI公司蝴蝶效應(yīng)研發(fā)的Manus,再到大廠和獨(dú)角獸的競(jìng)相加速,一場(chǎng)圍繞AI Agent的競(jìng)逐賽悄然拉開(kāi)帷幕。

這場(chǎng)競(jìng)速賽注定不容易。算力成本的指數(shù)級(jí)增長(zhǎng)、多輪對(duì)話中的幻覺(jué)誤差、場(chǎng)景落地的復(fù)雜程度……一如每一場(chǎng)技術(shù)風(fēng)暴來(lái)臨之時(shí),這些都是行業(yè)玩家們面臨的共同難題。

就像比爾·蓋茨曾說(shuō)的,“誰(shuí)能主宰AI Agent,那才是大事。因?yàn)槟銓⒂肋h(yuǎn)不用去搜索網(wǎng)站或者亞馬遜”。

從實(shí)驗(yàn)室走向產(chǎn)業(yè)前線,AI Agent的想象力很大,在技術(shù)與現(xiàn)實(shí)的博弈之間,精準(zhǔn)迅速地落地,給用戶一個(gè)可靠的AI助手,才是這場(chǎng)比賽的賽點(diǎn)。

1、從Operator到Manus,AI Agent為何令人興奮?

“求一個(gè)Manus邀請(qǐng)碼”。

上周,科技圈對(duì)這個(gè)名字一定不陌生。一如ChatGPT和DeepSeek在模型層的爆火,應(yīng)用層也發(fā)生了新的爆點(diǎn)。

這款號(hào)稱是“全球首款通用型AI Agent產(chǎn)品”,由中國(guó)AI創(chuàng)業(yè)公司推出。據(jù)團(tuán)隊(duì)介紹,Manus是一個(gè)真正自主的AI Agent,能夠解決各類復(fù)雜多變的任務(wù)。

該產(chǎn)品尚未完全對(duì)外開(kāi)放,內(nèi)測(cè)碼一碼難求,市場(chǎng)對(duì)Manus的好奇度已然達(dá)到頂峰。這是一種什么魔力?

很重要的一點(diǎn)在于,Manus展現(xiàn)出了更“類人”的能力。

圖源Manus官網(wǎng) 

Manus完全在獨(dú)立虛擬機(jī)中,能夠獨(dú)立思考、規(guī)劃并執(zhí)行復(fù)雜任務(wù),直接交付完整成果。在接到用戶指令后,它可以直接操作電腦完成一系列報(bào)告撰寫、表格制作等工作,并在最后導(dǎo)出符合用戶需求的產(chǎn)品。

在篩選簡(jiǎn)歷時(shí),Manus會(huì)自動(dòng)解壓文件、上傳簡(jiǎn)歷、瀏覽簡(jiǎn)歷,并記錄重要信息,給出自動(dòng)排名建議,還能根據(jù)工作經(jīng)驗(yàn)等重要維度,將候選人分為不同等級(jí)。

換句話說(shuō),Manus展現(xiàn)出了更進(jìn)一步的自我思考和自我規(guī)劃能力。與普通大模型不同,Manus不只是提供想法,還能幫用戶把想法變?yōu)楝F(xiàn)實(shí),解決實(shí)際問(wèn)題。

這背后,Manus的核心競(jìng)爭(zhēng)力在于其全鏈路自主執(zhí)行能力——Multiple Agent架構(gòu)。Manus通過(guò)“規(guī)劃-執(zhí)行-驗(yàn)證”的多代理協(xié)同架構(gòu),用戶不需要去對(duì)話引導(dǎo),也不需要提供建議,只需要等待Manus直接交付完整的任務(wù)成果。

一夜之間,Manus仿佛革了OpenAI和Anthropic的命。

實(shí)際上,市場(chǎng)對(duì)AI Agent更早的感知,來(lái)自于OpenAI和Anthropic。

今年1月,OpenAI推出了首款A(yù)I智能體Operator,基于Computer-Using Agent模型,Operator可以根據(jù)用戶指令,在云端執(zhí)行任務(wù),如訂餐、制定計(jì)劃、購(gòu)物等。

一個(gè)月后,OpenAI又推出了面向深度思考領(lǐng)域的智能體Deep Research,相比于Operator AI助手的定位,Deep Research像是一個(gè)“AI研究員“,它能將原本人類需要8小時(shí)的任務(wù)縮減到5分鐘,幫助人們?cè)诠ぷ髦泄?jié)省幾小時(shí)甚至幾天。

由OpenAI前研究副總裁達(dá)里奧·阿莫迪、大語(yǔ)言模型GPT-3論文的第一作者湯姆·布朗等人共同創(chuàng)立的企業(yè)Anthropic,布局AI Agent的動(dòng)作更早。去年10月,Anthropic基于Claude模型,推出了擴(kuò)展功能Computer Use,用戶能夠像指揮人類一樣指導(dǎo)Claude操作電腦,包括移動(dòng)光標(biāo)、點(diǎn)擊按鈕和輸入文本。

值得注意的是,Manus的出現(xiàn)讓大家紛紛想起了Devin。這個(gè)在去年由Cognition AI推出的全球首個(gè)AI軟件工程師。Devin也是一個(gè)自主Agent,能自主學(xué)習(xí)不熟悉的技術(shù),端到端地構(gòu)建和部署應(yīng)用程序,自己改bug,甚至還能訓(xùn)練和微調(diào)自己的AI模型。

在一個(gè)新興賽道,先發(fā)優(yōu)勢(shì)固然重要,但大家都在發(fā)力時(shí),好用就成為一個(gè)新的評(píng)判標(biāo)準(zhǔn)。

AI智能體的工作原理無(wú)外乎四個(gè)步驟:感知、信息處理、執(zhí)行、輸出。其中,想讓AI智能體真正化身人類的AI助手,效率和準(zhǔn)確度都很重要,這也是Manus此輪火爆的原因。

據(jù)Manus官方介紹,Manus在GAIA基準(zhǔn)測(cè)試中取得突破性成績(jī),其解決復(fù)雜問(wèn)題的準(zhǔn)確率比Open AI同類產(chǎn)品高出12%。

從Operator,到Maunus,AI Agent這把火顯然越燒越旺。本質(zhì)上,AI Agent之所以讓市場(chǎng)如此激動(dòng),是因?yàn)樗孉I完成了從被動(dòng)響應(yīng),到主動(dòng)執(zhí)行的躍遷。當(dāng)AI開(kāi)始突破認(rèn)知層,轉(zhuǎn)向行動(dòng)層,AI時(shí)代或許才真正到來(lái)。

2、大廠、獨(dú)角獸集體加速,AI Agent今年是爆發(fā)元年?

今年,ChatGPT掀起的大模型浪潮尚未平息,AI Agent也迎來(lái)爆發(fā)元年。

前不久,百度創(chuàng)始人李彥宏提出觀點(diǎn),2025年可能會(huì)成為AI智能體爆發(fā)的元年。推理大模型涌現(xiàn)出讓人驚嘆的深度思考能力,這將推動(dòng)人工智能的一個(gè)重要應(yīng)用方向,即“AI智能體”的落地。

放眼整個(gè)行業(yè),AI Agent處于風(fēng)口之上也是共識(shí)。市場(chǎng)研究機(jī)構(gòu)Gartner將Agentic AI列為2025年十大技術(shù)趨勢(shì)之一,并預(yù)測(cè)到2028年至少有15%的日常工作決策將由Agentic AI自主完成。德勤AI研究院稱,AI智能體將改變基礎(chǔ)業(yè)務(wù)模式,實(shí)現(xiàn)新的工作、運(yùn)營(yíng)和價(jià)值交付方式。

與GPT等對(duì)話式AI不同,AI Agent能像人類助手般獨(dú)立規(guī)劃任務(wù)、調(diào)用工具并交付成果。如果說(shuō)大模型讓AI長(zhǎng)出了“腦”,那AI Agent就是讓AI長(zhǎng)出了“手和腳”。

悄然間,AI領(lǐng)域的競(jìng)爭(zhēng)已悄然轉(zhuǎn)向更具想象力的戰(zhàn)場(chǎng)——AI Agent。國(guó)內(nèi)這場(chǎng)競(jìng)速賽中,科技大廠和AI獨(dú)角獸依舊是兩大主角。

大廠們的思路在于,利用AI智能體賦能業(yè)務(wù),完善AI應(yīng)用生態(tài),提高業(yè)務(wù)及自身在AI時(shí)代的競(jìng)爭(zhēng)力。

在AI領(lǐng)域強(qiáng)勢(shì)的百度,動(dòng)作莫過(guò)于最多。尤其是去年以來(lái),百度多次公布AI的進(jìn)展,智能體是反復(fù)提到的關(guān)鍵詞。百度已將智能體應(yīng)用到移動(dòng)生態(tài)的各個(gè)場(chǎng)景,包括百度新搜索、百度文庫(kù)、百度電商、文小言等產(chǎn)品。

其中,以文心智能體為代表,目前已經(jīng)吸引了15萬(wàn)家企業(yè)和80萬(wàn)名開(kāi)發(fā)者參與。據(jù)百度透露,文心智能體為百度搜索帶來(lái)了多輪對(duì)話、超級(jí)外腦、創(chuàng)意升級(jí)、擬人體驗(yàn)和多元推薦等五大新能力。

另一邊,阿里近期將AI智能體重點(diǎn)放在了To C領(lǐng)域,發(fā)布并開(kāi)源推理模型通義千問(wèn)QwQ-32B沒(méi)多久,阿里將其融入到通義APP中。3月10日,阿里通義App全新升級(jí),上線超級(jí)智能體。通義App以超級(jí)智能體作為交互中樞,用戶在通義首頁(yè)能問(wèn)、能聊,通義超級(jí)智能體還能理解圖片、生成圖片,翻譯、寫作等復(fù)雜功能。

同樣聚焦C端的還有騰訊。今年1月的騰訊2024員工大會(huì)上,騰訊創(chuàng)始人馬化騰表示,騰訊會(huì)持續(xù)投入資源進(jìn)行算力的儲(chǔ)備,希望各個(gè)事業(yè)部都能擁抱大模型的產(chǎn)品化落地場(chǎng)景。其中,包括微信、QQ、輸入法、瀏覽器等產(chǎn)品都將推出AI智能體,游戲、微信讀書、騰訊視頻等產(chǎn)品也將基于混元做更多AI探索。

相比于BAT結(jié)合自身深度思考大模型推出智能體,字節(jié)跳動(dòng)的智能體更像是追著OpenAI打。早在Operator發(fā)布前兩天,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)就已經(jīng)公布了同類型智能體UI-TARS,和Operator的功能基本差不多。識(shí)別過(guò)程基于視覺(jué)模型和推理實(shí)現(xiàn),能夠一步一步自動(dòng)完成跨應(yīng)用的復(fù)雜操作,并兼容各種系統(tǒng)。

不僅如此,憑借算力、數(shù)據(jù)等優(yōu)勢(shì),大廠基本都是在模型端、應(yīng)用端、智能體開(kāi)發(fā)平臺(tái)協(xié)同三個(gè)領(lǐng)域閉環(huán)發(fā)展。

一站式智能體開(kāi)發(fā)平臺(tái)方面,字節(jié)跳動(dòng)的扣子、騰訊云的騰訊元器、百度智能云千帆AgentBuilder、阿里云大模型平臺(tái)百煉均已上線。

而在AI獨(dú)角獸中,智譜是最早探索Agent的初創(chuàng)企業(yè)。去年10月,推出自主智能體AutoGLM ;一個(gè)月后的Agent OpenDay上,智譜展示了AI Agent的最新成果,包括AutoGLM、AutoGLM-Web、GLM-PC三個(gè)版本,對(duì)應(yīng)手機(jī)、瀏覽器、電腦的應(yīng)用場(chǎng)景。

圖片

據(jù)悉,新升級(jí)的AutoGLM能夠理解超長(zhǎng)指令,執(zhí)行超長(zhǎng)任務(wù),在多步、循環(huán)任務(wù)中,AutoGLM的速度表現(xiàn)超過(guò)人手動(dòng)操作。今年1月,Agent GLM-PC 1.1正式版上線,操作速度和任務(wù)成功率均有提升。

需要注意的是,經(jīng)過(guò)2023年的百模大戰(zhàn),2024年的應(yīng)用之爭(zhēng),行業(yè)淘汰賽加劇,2025年對(duì)于初創(chuàng)企業(yè)而言,落地路線的選擇至關(guān)重要。

2月21日,階躍星辰宣布發(fā)力智能終端Agent方向。階躍星辰與吉利汽車集團(tuán)、OPPO、智元機(jī)器人等企業(yè)深化合作關(guān)系,尤其是智能終端Agent的開(kāi)發(fā),同時(shí)還展示了在金融財(cái)經(jīng)、內(nèi)容創(chuàng)作、新零售、數(shù)字人等領(lǐng)域的創(chuàng)新和應(yīng)用。

去年5月,月之暗面的Kimi上線了Kimi+智能體商店,旗下有20多個(gè)由官方提供的智能體。

相較于互聯(lián)網(wǎng)大廠而言,AI初創(chuàng)企業(yè)布局智能體的思路在于,通過(guò)自身模型能力與智能體的結(jié)合,推出更多可場(chǎng)景化的落地方案,尋找商業(yè)變現(xiàn)的路徑。

隨著技術(shù)的不斷發(fā)展和市場(chǎng)的逐漸成熟,AI Agent 領(lǐng)域的競(jìng)爭(zhēng)將愈發(fā)激烈,各企業(yè)的產(chǎn)品也將不斷迭代升級(jí),以滿足用戶日益增長(zhǎng)的需求。

3、想象力大,落地卻不易

Manus的火爆很突然,以至于Manus的團(tuán)隊(duì)低估了市場(chǎng)的熱情。

Manus AI團(tuán)隊(duì)產(chǎn)品負(fù)責(zé)人張濤近日在朋友圈發(fā)文表示,“這本是一個(gè)產(chǎn)品探索過(guò)程中的階段性收獲分享,因此服務(wù)器資源是對(duì)標(biāo)demo水平來(lái)準(zhǔn)備,不曾想過(guò)會(huì)引起巨大波瀾。”

這段話的背景在于,Manus爆火之后,關(guān)于Manus通用型的“套殼”嫌疑、官網(wǎng)卡頓等質(zhì)疑聲層出不窮。所謂“套殼”,即Manus沒(méi)有自研底層大模型的能力,其模型能力主要來(lái)自Anthropic的Claude。

Manus團(tuán)隊(duì)已聲明,當(dāng)前的Manus距離正式版想交付給大家的體驗(yàn)還差很遠(yuǎn)。“像模型幻覺(jué)、交付物友好度、運(yùn)行速度等方面都還有很大的提升空間。”

事實(shí)上,Manus的困境是當(dāng)下AI Agent賽道的縮影。

首當(dāng)其沖的就是AI幻覺(jué)問(wèn)題。OpenAI的Operator可能因數(shù)據(jù)污染生成錯(cuò)誤結(jié)論;Manus在演示中雖流暢,實(shí)際應(yīng)用中卻常因系統(tǒng)權(quán)限限制無(wú)法完成訂餐、支付等任務(wù)。

這些所謂的幻覺(jué)問(wèn)題是目前的AI技術(shù)無(wú)法避免的。DeepSeek-R1幻覺(jué)率高達(dá)14.3%,GPT-4.5幻覺(jué)率為7.1%,某種程度上,AI幻覺(jué)能力與其推理能力正相關(guān)。也就是說(shuō),越聰明的AI大概率幻覺(jué)越強(qiáng)。

這對(duì)AI Agent無(wú)疑是個(gè)老大難。作為提高效率的AI助手,用戶的終極需求莫過(guò)于準(zhǔn)確性,而幻覺(jué)問(wèn)題可能為用戶帶來(lái)了包括檢查、復(fù)查等多個(gè)環(huán)節(jié),勢(shì)必成為AI Agent爆發(fā)的主要障礙。

尤其是在金融、醫(yī)療、法律等高風(fēng)險(xiǎn)領(lǐng)域,任何誤差都可能引發(fā)暴風(fēng)雨,這也就限制了AI Agent的場(chǎng)景落地。

更重要的是,相比于對(duì)話式的GPT,AI Agent的一個(gè)重要進(jìn)步在于“有記憶”。Manus通用型Agent就具備“記憶能力”,若用戶曾要求“用表格呈現(xiàn)結(jié)果”,下次任務(wù)中它會(huì)主動(dòng)生成Excel文件。一旦出現(xiàn)幻覺(jué)問(wèn)題,AI Agent作為工具的實(shí)用性也要受到質(zhì)疑。

本質(zhì)上,幻覺(jué)問(wèn)題的來(lái)源于數(shù)據(jù)的缺乏。正如人類通過(guò)理論和實(shí)踐在社會(huì)發(fā)展過(guò)程中的不斷學(xué)習(xí)和進(jìn)化,AI則需要源源不斷的數(shù)據(jù)反饋來(lái)進(jìn)化,而數(shù)據(jù)的訓(xùn)練離不開(kāi)實(shí)際的應(yīng)用落地。

就目前實(shí)際應(yīng)用而言,C端智能體大多定位智能助手,可通過(guò)讀取語(yǔ)音指令理解用戶意圖,并模擬人類行為,完成訂機(jī)票、點(diǎn)外賣、篩簡(jiǎn)歷等基礎(chǔ)日常需求和工作。

這時(shí)候,用戶留存和心智培養(yǎng)是個(gè)問(wèn)題。像Manus這類主打通用的Agent,或許很難在垂直場(chǎng)景下發(fā)揮作用。而人類社會(huì)正是由一個(gè)個(gè)具體的場(chǎng)景構(gòu)成的,復(fù)雜程度難以想象,通用型Agent最終能在用戶生活實(shí)際起到多大作用,還是未知。

另一邊,B端智能體則需要提供更為專業(yè)和定制化的服務(wù)。在B端場(chǎng)景下,Agent可充當(dāng)數(shù)字員工、個(gè)人助理、營(yíng)銷客服等工種,真正為企業(yè)創(chuàng)造價(jià)值。

一些聲音認(rèn)為,B端Agent市場(chǎng)有望率先起量。具體到玩家身上,據(jù)The Information報(bào)道,OpenAI計(jì)劃為專業(yè)人士推出量身定制版Agent,用于執(zhí)行銷售線索分類、軟件工程和博士級(jí)研究等高級(jí)任務(wù)。針對(duì)“高收入知識(shí)工作者”,每月2000美元;用于軟件開(kāi)發(fā)的,每月1萬(wàn)美元;博士級(jí)研究代理,每月2萬(wàn)美元。

從目前的發(fā)展趨勢(shì)來(lái)看,AI Agent 最有可能在企業(yè)服務(wù)和辦公場(chǎng)景中率先落地。在企業(yè)服務(wù)領(lǐng)域,AI Agent可以幫助企業(yè)實(shí)現(xiàn)業(yè)務(wù)流程的自動(dòng)化和智能化,降低人力成本,提高工作效率。在辦公場(chǎng)景中,AI Agent可以成為員工的智能助手,協(xié)助完成各種辦公任務(wù),提升辦公體驗(yàn)。

IDC發(fā)布預(yù)測(cè)稱,到2026年將有50%的中國(guó)500強(qiáng)數(shù)據(jù)團(tuán)隊(duì)使用AI Agent來(lái)實(shí)現(xiàn)數(shù)據(jù)準(zhǔn)備和分析,并成為重要組織者和協(xié)調(diào)者;40%的中國(guó)500強(qiáng)企業(yè)將實(shí)現(xiàn)數(shù)據(jù)智能與AI模型智能的結(jié)合,以統(tǒng)一AI模型和數(shù)據(jù)的綜合治理政策、實(shí)踐和技術(shù)。

不過(guò),想要真正作為AI助手對(duì)接企業(yè)也有不少難題。企業(yè)的業(yè)務(wù)流程和需求各不相同,如何將AI Agent與企業(yè)的現(xiàn)有系統(tǒng)和業(yè)務(wù)流程進(jìn)行無(wú)縫集成,是一個(gè)關(guān)鍵問(wèn)題。

這需要AI Agent具備高度的定制化能力和兼容性,能夠根據(jù)企業(yè)的具體需求進(jìn)行靈活配置和調(diào)整。同時(shí),企業(yè)對(duì)數(shù)據(jù)安全和隱私保護(hù)也非常重視,AI Agent 在處理企業(yè)數(shù)據(jù)時(shí),必須確保數(shù)據(jù)的安全性和保密性,防止數(shù)據(jù)泄露和濫用。

落地當(dāng)然是不容易的,這需要不斷擴(kuò)展的算力、數(shù)據(jù)、場(chǎng)景做支撐,好在市場(chǎng)的熱情已經(jīng)被點(diǎn)燃,玩家都在為“讓AI幫人做事”而努力。

當(dāng)大模型與Agent深度融合,一個(gè)更智能、更主動(dòng)、更個(gè)性化的AI時(shí)代正加速到來(lái),這一次,獨(dú)角獸和大廠們都在加速奔跑,沒(méi)有一個(gè)甘心落后于時(shí)代。

       原文標(biāo)題 : 競(jìng)逐AI Agent時(shí)代

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)