訂閱
糾錯
加入自媒體

具身智能,沒在元年落地

圖片

12月初,國內(nèi)兩所領(lǐng)先高校先后推出了具身智能專業(yè)。這像是產(chǎn)學(xué)屆一次盛大的牽手,讓觀眾們幻想屬于國產(chǎn)具身智能的美滿未來。

12月8日,智元機(jī)器人宣布5000臺產(chǎn)品量產(chǎn)。2025年是國內(nèi)具身智能飛速發(fā)展的一年,從年初登上春晚舞臺,到年末進(jìn)入頂級學(xué)術(shù)殿堂。具身智能賽道的參與者越來越多,而對其的理解也越來越豐富多元。

有人認(rèn)為,具身智能是AI的物理表征,有人認(rèn)為,具身智能是新的交互范式;你難以找到一個所有人都同意的定義,但有一個觀點(diǎn)人人認(rèn)同:具身智能跟我有關(guān)。

01

具身智能做不了什么?

大模型時(shí)代里,所有的工業(yè)體系都值得被重新做一遍。

樂觀者們在問“具身智能不能做什么?”

旁觀者們在看,“具身智能可以疊衣服、可以做物流,可以踢足球,可以吸引人,還可以......”

繁榮的demo和真實(shí)的落地之間還存在巨大的差距。為了融資,具身智能們?nèi)急M“想象力”demo可以展示一種能力,但不同的demo體現(xiàn)的卻不一定展示了不同的算法能力。目前行業(yè)出現(xiàn)了一種“橫向擴(kuò)展”demo的現(xiàn)象,即所有的“花樣”其實(shí)是“一樣”,用相同元素的排列組合,營造一種虛假的繁榮。這樣的矛盾是具身智能擴(kuò)張與技術(shù)積累的平衡之難;太深的技術(shù)積累,會導(dǎo)致投資太高,難以出成果,以至于被淘汰。

demo遍地,12月已至具身智能尚未落地。第一個原因是,具身智能的能力還沒有達(dá)到規(guī);拈T檻。討論具身智能的能力,要看具能智能簡單任務(wù)的成功率、節(jié)拍、成本、可靠性。

雖然一些具身智能高度結(jié)構(gòu)化的實(shí)驗(yàn)室環(huán)境下表現(xiàn)穩(wěn)定,任務(wù)成功率可能超過80%,但如果放到真實(shí)環(huán)境下其成功率可能大幅度降低。更重要的是,即便單個任務(wù)成功率能提高,但是對于長程任務(wù)來講,其成功率是相乘的結(jié)果,而小于1的數(shù)字相乘,得到的結(jié)果自然只會更低。

具身智能的真正落地既要找到合適的場景,也要保證成功率的提高。這條路要走多久還未可知,但可以確定的答案是具身智能的規(guī)模增長與demo的增長并不是絕對的正相關(guān)。就像狼來了的故事,人們曾在2015年聽過“這一年是具身智能的元年”

02

具身智能的chatgpt時(shí)刻

具身智能要在真實(shí)世界得到應(yīng)用,讓所有人都想去用它,才會出現(xiàn)chatgpt時(shí)刻。

資本急于開拓具身智能的使用場景,但具身智能的公司們卻還要思考如何應(yīng)用,在哪些場景應(yīng)用。12月3日,特斯拉展示了機(jī)器人奔跑的視頻。是的,具身智能跑起來了,然后呢?在怎樣的場景下,需要機(jī)器人替代人類去跑步呢?

產(chǎn)業(yè)現(xiàn)在將具身智能未來落地方向主要?dú)w結(jié)為三個場景:商業(yè)服務(wù)場景、工業(yè)場景、家庭場景。具身智能落地的順序也很大概率會是先商業(yè)服務(wù)再工業(yè)服務(wù)最后走進(jìn)家庭。

這樣的順序主要因?yàn)榫呱碇悄艿男枰罅康臄?shù)據(jù)訓(xùn)練,以建立一個世界模型。在這個模型之中,具身智能要可以思考,也可以預(yù)測下一步。然而,就像一個雞與蛋的問題,因?yàn)榫呱碇悄懿痪邆鋵?shí)際場景中大量采集數(shù)據(jù)的機(jī)會,導(dǎo)致也就無法快速地去建立模型。商業(yè)場景特別是酒店類,因?yàn)榄h(huán)境較為固定更容易訓(xùn)練,從價(jià)值來看,送餐機(jī)器人確實(shí)也解決了人力成本。

工業(yè)場景對效率要求高,替代自動化的效率會是硬性門檻。我們看到,即便機(jī)器人能夠完美復(fù)刻一些工業(yè)操作,但相對于人手來講,其速度并不占優(yōu)勢。從用戶側(cè)來說,付費(fèi)購買更慢的“人力資源”是一個虧本交易。從技術(shù)側(cè)來說,由于工業(yè)場景碎片化,數(shù)據(jù)難收集,因此難以起量,就更難打破成本、效率的限制。

最后,再說說家庭服務(wù)。對于具身智能進(jìn)入家庭的前景其實(shí)有兩個極端的角度,如果說只需要期待陪伴、對話作用,或許具身智能可以很快的進(jìn)入消費(fèi)領(lǐng)域。畢竟從智能家居開始,到現(xiàn)在的AI玩具,已經(jīng)人機(jī)交互已經(jīng)不是新鮮事。但是如果具身智能要真正成為一個家庭的“家庭成員”,那它面臨著安全,以及成本問題。而被定義為“家庭成員”的具身智能多是覆蓋醫(yī)療、養(yǎng)老場景,審視其安全性更要慎重。

對于具身智能的普及之路,過程大概是從專精到通用。最開始,可能是單場景單任務(wù)的穩(wěn)定執(zhí)行;然后過渡到單場景多任務(wù)的執(zhí)行;最后是,多場景多任務(wù)的穩(wěn)定執(zhí)行。

具身智能的發(fā)展也需要行業(yè)的共識,即一套基準(zhǔn)測試,運(yùn)動會賽不出具身智能的真差距。這一點(diǎn)的突破需要產(chǎn)學(xué)研的結(jié)合。學(xué)界方面,除了清華大學(xué)、上海交大已經(jīng)宣布增設(shè)具身智能專業(yè),還有一批國內(nèi)高校正在申請具身智能專業(yè)。

03

具身智能的繁榮與焦慮

千百年來,人們一直夢想著造出某種人造物,能自動完成憑借人類智慧、能力才能實(shí)現(xiàn)的工作。

在荷馬史詩《伊利亞特》中,掌管鍛造、雕刻的鐵匠之神赫菲斯托斯造出了金屬機(jī)器人和黃金打造的仆人,幫助他完成雜務(wù)。亞里士多德預(yù)言了自動化工具的出現(xiàn),讓勞動變得不再必要!读凶印分兄v述了工匠偃師為周穆王制作了一個栩栩如生、能歌善舞、甚至有感情的“機(jī)關(guān)人偶”!陡窳蟹鹩斡洝分忻枋隽艘粋機(jī)械裝置,有了它,“最愚蠢無知的人也可以撰寫哲學(xué)、詩歌、政治、法律、數(shù)學(xué)和神學(xué)方面的書籍,不必憑借天賦或加以學(xué)習(xí)”。

過去,人們對具身智能的暢想總是,替代人類去做無聊的、重復(fù)性的、低價(jià)值的工作;于此同時(shí)人們又擔(dān)心他們發(fā)展成為“掌控”人類的神,2025年圍繞AI對人力的沖擊就印制了這一點(diǎn)。因此具身智能的未來,不一定是替代重復(fù)性的工作,或許讓他們能夠替代人類進(jìn)行危險(xiǎn)工作,才更有意義。

雖然焦慮具身智能的未來,但具身智能帶來了相當(dāng)多產(chǎn)業(yè)的繁榮。對于芯片行業(yè)來說,一大批芯片廠商找到了產(chǎn)品的新增長空間。

邊緣端,多家國產(chǎn)芯片廠商發(fā)布具身智能產(chǎn)品。極海發(fā)布G32R501實(shí)時(shí)控制MCU可滿足具身機(jī)器人在感知與決策、運(yùn)動控制以及高效人機(jī)交互等方面的高算力、高效率與高精準(zhǔn)度等性能需求。以“MCU+Driver+IPM”全棧式電機(jī)專用芯片為核心,搭配極海自研電機(jī)算法平臺,可應(yīng)用于機(jī)器人關(guān)節(jié)、工業(yè)編碼器、無框力矩電機(jī)等核心場景,構(gòu)建具身智能“神經(jīng)中樞”。

國民技術(shù)N32H7系列MCU憑借多核異構(gòu)架構(gòu)與超高主頻,提供強(qiáng)大算力與實(shí)時(shí)響應(yīng)能力,能夠滿足人形機(jī)器人對復(fù)雜控制與高同步性的嚴(yán)苛要求。其內(nèi)置的CORDIC協(xié)處理器能夠高效完成運(yùn)動學(xué)涉及的三角/坐標(biāo)變換等數(shù)學(xué)計(jì)算,顯著釋放CPU負(fù)載。

全志科技MR系列機(jī)器人芯片采用12nm制程,集成CPU+GPU+NPU異構(gòu)架構(gòu),算力達(dá)3-4TOPs,功耗僅5W,支持毫秒級響應(yīng),為小米CyberDog、宇樹Unitree系列等產(chǎn)品提供運(yùn)動控制和環(huán)境感知核心算力,成本僅為英偉達(dá)Jetson Nano的1/3。

瑞芯微的RK3588采用八核64位ARM架構(gòu) ,4顆cortex-A76 高性能內(nèi)核(主頻達(dá)2.4GHz)與4顆Gortex-A55 能效內(nèi)核(主頻2.0GHz)組合多任務(wù)處理和復(fù)雜計(jì)算能力出色。內(nèi)置6TOPS 算力的NPU,支持多種數(shù)據(jù)類型與主流深度學(xué)習(xí)框架,能高效處理圖像識別、語音交互等A任務(wù)。業(yè)內(nèi)人士透露,瑞芯微面向具身智能行業(yè)已經(jīng)出貨上萬片相關(guān)產(chǎn)品。

佰維存儲表示已推出適用于具身智能領(lǐng)域的eMMC、UFS、BGA SSD、LPDDR4X/5/5X 等產(chǎn)品,并積極拓展具身智能領(lǐng)域頭部客戶。根據(jù)第三方媒體拆解報(bào)告,宇樹科技的Go2智能機(jī)器狗中已應(yīng)佰維存儲的LPDDR4X、eMMC存儲產(chǎn)品。

算力端,英特爾、英偉達(dá)仍是機(jī)器人“頭部”算力的核心玩家。正如前文所說,具身智能的VLA需要構(gòu)建世界模型,而構(gòu)建模型必然帶動算力需求。英特爾通過推出GPU+NPU+CPU的異構(gòu)系統(tǒng),滿足運(yùn)動控制、AI推理的不同負(fù)載要求,實(shí)現(xiàn)VLA模型運(yùn)行。

此外,除了聚焦硬件,英偉達(dá)推出了NVIDIA Cosmos 平臺以加速物理AI。該平臺可以整合前沿生成式世界基礎(chǔ)模型 (WFM) 先進(jìn)分詞器、護(hù)欄以及用于加速數(shù)據(jù)處理和管理的高效工作流的集成平臺。為世界模型訓(xùn)練提供支持,并加速智能汽車(AV) 和機(jī)器人的物理 AI 開發(fā)。

因?yàn)樯婕皺C(jī)械控制、邊緣算力等緩解,具身智能的芯片供應(yīng)商和汽車芯片的供應(yīng)商具有很高重合度。而具身智能的發(fā)展和汽車的發(fā)展也有了一些相似之處。

1885年,卡爾·本茨 制造了第一輛使用汽油內(nèi)燃機(jī)驅(qū)動的三輪車;蛟S,機(jī)器人現(xiàn)在的“社會角色”就像和汽車在1900-1910 年:是技術(shù)奇觀,卻不是社會基礎(chǔ)設(shè)施。而現(xiàn)在汽車已經(jīng)成為隨處可見的普通角色,具身智能的發(fā)展還要一定時(shí)間,但不會是百年之久。

確定的是,我們看到的是具身機(jī)器人角色還沒定型,但不是能力不足。

       原文標(biāo)題 : 具身智能,沒在元年落地

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號