訂閱
糾錯(cuò)
加入自媒體

DeepSeek顛覆一切?人形機(jī)器人集體轉(zhuǎn)身:攔路虎被消滅了

2025-02-08 10:43
雷科技
關(guān)注

開源的 DeepSeek是人形機(jī)器人「進(jìn)化」的催化劑。

如果說 2023、2024 開年科技行業(yè)最重要的新聞分別是 ChatGPT 和 Sora,那 2025 開年科技行業(yè)最重要的新聞毫無疑問就是——DeepSeek(R1)。

只看一點(diǎn),從國(guó)內(nèi)到海外,不斷有科技互聯(lián)網(wǎng)公司宣布接入甚至基于 DeepSeek 開發(fā)產(chǎn)品。其中雖然有不少是出于「蹭熱點(diǎn)」的營(yíng)銷,但更多廠商也確實(shí)是看到了 DeepSeek R1 的巨大潛力,包括看似關(guān)系不大的人形機(jī)器人廠商。

2 月 7 日,作為國(guó)內(nèi)人形機(jī)器人第一股,優(yōu)必選官方就表示公司正在人形機(jī)器人應(yīng)用場(chǎng)景中驗(yàn)證 DeepSeek 技術(shù)的有效性,如多模態(tài)人機(jī)交互、復(fù)雜環(huán)境中的指令理解、工業(yè)場(chǎng)景中的任務(wù)分解與規(guī)劃等,「有望利用推理大模型的深度思考能力解決這些復(fù)雜任務(wù)中的挑戰(zhàn),讓人形機(jī)器人更加接近人的思考和行為表現(xiàn)!

優(yōu)必選可能并非個(gè)例。

就在兩天前,一度引起全球科技圈集體關(guān)注的硅谷人形機(jī)器人公司 Figure,創(chuàng)始人 Brett Adcock 突然在 X 平臺(tái)上宣布決定終止與 OpenAI 的合作,并轉(zhuǎn)向內(nèi)部自主開發(fā)端到端的機(jī)器人 AI。

SCR-20250207-odyi.png

圖/ X

Brett Adcock 還透露,F(xiàn)igure 目前已經(jīng)取得「a major breakthrough(重大突破)」,將在接下來 30 天展示一些從未在人形機(jī)器人上見過的東西?紤]到最近一段時(shí)間人工智能行業(yè)最大的變化就是 DeepSeek 的開源模型,很多人認(rèn)為 Figure 是在基于 DeepSeek R1 等開源模型進(jìn)行開發(fā)機(jī)器人 AI。

甚至,打造出白菜價(jià)人形機(jī)器人的宇樹科技也傳出了與 DeepSeek 達(dá)成深度合作的消息。而更多的人形機(jī)器人廠商,或許都在思考和謀劃基于 DeepSeek 模型的新路線,就像優(yōu)必選一樣。

但不管是或不是,DeepSeek 正在改寫的 AI 敘事,似乎不可避免將改變?nèi)诵螜C(jī)器人的故事方向。

DeepSeek如何消滅人形機(jī)器人普及的攔路虎?

優(yōu)必選和 Figure 的「轉(zhuǎn)身」,并非偶然。事實(shí)上,DeepSeek 的出現(xiàn),恰好擊中了當(dāng)前人形機(jī)器人的痛點(diǎn),首當(dāng)其沖的就是「成本」。

了解人形機(jī)器人研發(fā)的人都知道,訓(xùn)練一個(gè)具身智能的機(jī)器人,需要消耗大量的算力。而算力,意味著真金白銀的投入?萍季揞^之所以能在人工智能領(lǐng)域呼風(fēng)喚雨,除了技術(shù)領(lǐng)先外,更重要的是它們有足夠的財(cái)力支撐起「天價(jià)」的算力支出。

但對(duì)于大多數(shù)人形機(jī)器人初創(chuàng)公司來說,高昂的算力費(fèi)用無疑是一筆巨大的負(fù)擔(dān)。另一方面,數(shù)據(jù)匱乏更是整個(gè)行業(yè)共同面臨的困境,甚至 OpenAI 四年前解散人形機(jī)器人團(tuán)隊(duì)就是因?yàn)閿?shù)據(jù)極其匱乏的難題。

這也是為什么去年年底智元機(jī)器人開源百萬真機(jī)數(shù)據(jù)集 AgiBot World,引起了廣泛關(guān)注。

SCR-20250207-qpub.jpeg

AgiBot World 數(shù)據(jù)集在 GitHub,圖/雷科技

智元機(jī)器人聯(lián)合創(chuàng)始人、首席技術(shù)官彭志輝(稚暉君)就提到,具身智能領(lǐng)域,真機(jī)數(shù)據(jù)的采集成本和門檻非常高。但實(shí)際上,「百萬真機(jī)數(shù)據(jù)集」在一些業(yè)內(nèi)人士看來也只是杯水車薪,「只能訓(xùn)練一個(gè)動(dòng)作的泛化,譬如分揀,對(duì)實(shí)現(xiàn)理想狀態(tài)中的具身智能還遠(yuǎn)不夠。」

這就像一個(gè)有天賦的運(yùn)動(dòng)員,卻苦于沒有訓(xùn)練場(chǎng)地和器材,最終也只能泯然眾人矣。但 DeepSeek R1 的出現(xiàn),卻很有可能改變了這一切。

最直接的一點(diǎn)就是 4 元/百萬 tokens(緩存未命中)、1 元/百萬 tokens(緩存命中)的輸入價(jià)格和 16 元/百萬 tokens 的輸出價(jià)格,讓 DeepSeek R1 在推理成本上的優(yōu)勢(shì)一覽無遺。

 

DeepSeek R1 Price.jpeg

圖/ DeepSeek

與之相比,OpenAI o1 正式版的 API 價(jià)格分別是 55 元、110 元、438 元。僅這一點(diǎn),就能讓人形機(jī)器人公司終于可以擺脫「天價(jià)」算力的束縛,將更多的資金投入到機(jī)器人本體的研發(fā)中,加速產(chǎn)品的迭代和升級(jí)。

當(dāng)然,根本還在于 DeepSeek R1 作為性能上與 OpenAI o1 比肩的頂級(jí)推理模型,可以低成本地提供強(qiáng)大的數(shù)學(xué)、代碼以及自然語(yǔ)言推理等能力,正如優(yōu)必選所期望的——改進(jìn)人形機(jī)器人面對(duì)復(fù)雜任務(wù)的指令理解、任務(wù)規(guī)劃和分解,「讓人形機(jī)器人更加接近人的思考和行為表現(xiàn)!

不單如此,DeepSeek R1 的一大優(yōu)勢(shì)還在于算法的改進(jìn)和優(yōu)化,不像以前要求那么大的數(shù)據(jù)量。一方面是基于數(shù)據(jù)蒸餾實(shí)現(xiàn)自動(dòng)篩選高價(jià)值數(shù)據(jù),同時(shí)也通過對(duì)抗訓(xùn)練生成合成數(shù)據(jù),將高質(zhì)量代碼數(shù)據(jù)獲取成本從每 100 個(gè) tokens 的 0.8 元降低至 0.12 元。

DeepSeek-R1 的官方新聞稿中也提到了,DeepSeek-R1 在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),「在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。」

SCR-20250207-qqmf.png

圖/ DeepSeek

這對(duì)于困于數(shù)據(jù)難題的具身智能來說極具重要性,實(shí)際上也為整個(gè)具身智能領(lǐng)域指明了方向。更何況,DeepSeek-R1 還是開源的,允許開發(fā)者和廠商自由修改、蒸餾。

換言之,所有人形機(jī)器人都可以基于 DeepSeek-R1 開發(fā)更適合自己的頂級(jí)推理模型,甚至沿著 DeepSeek 的技術(shù)路線重新訓(xùn)練真正屬于具身智能的模型。盡管很難直接橫向?qū)Ρ,但在整體性能比肩 OpenAI o1 的同時(shí),DeepSeek R1 毋庸置疑大幅降低了頂級(jí)模型的訓(xùn)練成本。

開源的 DeepSeek,人形機(jī)器人「進(jìn)化」的催化劑

今天打造一款人形機(jī)器人,最重要的技術(shù)就在于機(jī)電和大模型,如果說前者對(duì)應(yīng)「身體」,后者則是對(duì)應(yīng)「大腦」。

而除了「成本」之外,技術(shù)的自主性也是制約人形機(jī)器人發(fā)展的一大因素。一般來說,此前人形機(jī)器人廠商要么是自主開發(fā)模型,要么就是選擇與 OpenAI、Google、科大訊飛、華為等大模型廠商合作。最典型的例子就是 Figure 與 OpenAI 的合作。

其實(shí)不難理解合作的方式,自主開發(fā)的問題在于訓(xùn)練成本高昂,技術(shù)上也難以追趕領(lǐng)先的 AI 巨頭。不過與此對(duì)應(yīng)的是,選擇合作也意味著在技術(shù)上的依賴,不僅需要面對(duì)不菲的推理成本,更重要的是模型適配度、開發(fā)節(jié)奏上受制于大模型廠商。

BMW_Factory_View-1280x720.jpg

Figure 02 在寶馬工廠,圖/ Figure

DeepSeek 的開源策略,則為人形機(jī)器人公司提供了新的選擇。通過開源,DeepSeek 讓人形機(jī)器人公司可以基于其模型進(jìn)行二次開發(fā),構(gòu)建自己的技術(shù)閉環(huán),真正掌握核心技術(shù)的主動(dòng)權(quán)。

開源意味著越來越多的機(jī)器人可以直接使用先進(jìn)的 AI 技術(shù),而不必從零開始開發(fā)自己的解決方案。對(duì)于優(yōu)必選、Figure 等人形機(jī)器人廠商而言,這種技術(shù)門檻的降低意味著可以將更多資源集中在硬件開發(fā)和實(shí)際應(yīng)用的優(yōu)化上。

尤其是 DeepSeek 的出現(xiàn)讓更多人形機(jī)器人廠商看到了自主研發(fā)的優(yōu)勢(shì),不僅是成本和技術(shù)門檻的大幅降低,還能定制自己的大模型,同時(shí)構(gòu)建技術(shù)閉環(huán)。

還是以 Figure 為例,之所以與 OpenAI 分道揚(yáng)鑣,直接的一個(gè)原因可能在于 OpenAI 早就被曝光內(nèi)部也在自研人形機(jī)器人。可以預(yù)見的是,相比 Figure 這種參股的「干兒子」,OpenAI 在開發(fā)模型上無疑會(huì)更重視自家的「親兒子」的需求和發(fā)展路線。

然而更深層的問題在于,F(xiàn)igure 始終還是會(huì)受制 OpenAI 的技術(shù)路線、成本等,如果繼續(xù)合作很可能面臨成本上的巨大劣勢(shì)。反過來,得益于 DeepSeek 等開源模型的強(qiáng)大和經(jīng)濟(jì),不僅在綜合成本可能還有優(yōu)勢(shì),更重要的是能夠構(gòu)建自主的技術(shù)閉環(huán),適配自身的迭代路線和產(chǎn)品節(jié)奏。

DeepSeek-VL,人形機(jī)器人的 One more thing?

不僅是 DeepSeek-R1,在很多人還震撼 R1 超高性價(jià)比之余,并不知道 DeepSeek 這幾天剛提出了一個(gè)全新的視覺語(yǔ)言模型——DeepSeek-VL。

SCR-20250207-qtri.png

DeepSeek 新論文,圖/ DeepSeek

雖然目前僅公開 1.3B 與 7B 兩個(gè)版本的模型,但 DeepSeek-VL 追求的基于現(xiàn)實(shí)場(chǎng)景的領(lǐng)先性能,同時(shí)多次強(qiáng)調(diào)保留強(qiáng)大的「語(yǔ)言能力」——這一點(diǎn)可能被很多大模型和人形機(jī)器人廠商都忽略了。

DeepSeek 團(tuán)隊(duì)在論文中就強(qiáng)調(diào),「在訓(xùn)練過程中,我們不僅進(jìn)行多模態(tài)數(shù)據(jù)訓(xùn)練,還將大量語(yǔ)言數(shù)據(jù)納入訓(xùn)練!

但這條技術(shù)路線的正確與否,最終還是要「實(shí)踐出真知」,就像 DeepSeek-R1 一樣。不過對(duì)于人形機(jī)器人廠商來說,在 DeepSeek-R1 之外,DeepSeek-VL 確實(shí)可能成為了人形機(jī)器人加速走向落地的 One more thing。

來源:雷科技

       原文標(biāo)題 : DeepSeek顛覆一切?人形機(jī)器人集體轉(zhuǎn)身:攔路虎被消滅了

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)