訂閱
糾錯
加入自媒體

【年度專題】XR終端,能否吃到AI落地的最佳紅利?

2025-01-23 14:50
VR陀螺
關注

文/VR陀螺 萬里

不出意外,剛結束的2024年又是被AI狠狠刷屏的一年。

這一年以來,AI曾助推微軟以及英偉達先后登上了全球市值第一的寶座;諾貝爾物理學獎、化學獎兩大重磅獎項均與AI相關,另據CB Insights數(shù)據顯示,今年Q3季度,全球有接近1/3的風投都流向了AI初創(chuàng)企業(yè)。

在XR領域,那些已經落地亦或是正在籌備的終端產品當中,里面均能看到AI的身影,而AI功能也將成為后續(xù)MR、AR硬件的核心用例之一。本文將回顧這一年以來AI的應用落地盛況。

 兩件大事:AI眼鏡起風、兩款AR新品 

如果說2023年對于理想AI硬件形態(tài)仍有不少爭論,那么到了2024年,指向性已經明確了許多。

去年開春曾有三大重磅AI終端產品:Ray-Ban Meta、Humane Ai Pin以及Rabbit R1,它們分別是眼鏡形態(tài)、胸針形態(tài)以及手持設備形態(tài),從銷量以及用戶反饋來看,眼鏡形態(tài)的Ray-Ban Meta均位于前列。此外,Ray-Ban Meta已經于去年銷量突破100萬臺,得到了市場初步驗證。

另外,我們也可以觀察這一年以來一眾頭部AI巨頭的硬件布局以及發(fā)聲:

7月,比爾蓋茨出席博客節(jié)目《the Next Big Idea》時曾提到,未來AI Agent的理想硬件形態(tài)可能包括耳機以及智能眼鏡兩種。

9月,Meta亮相了其首款AR眼鏡Orion,扎克伯格表示早在2014年團隊便萌生了構建下一代計算平臺的想法,這一硬件是眼鏡,它可以實現(xiàn)全息顯示以及AI助理兩大能力。“眼鏡具有獨特的優(yōu)勢,可以讓人們看到你所看到的,聽到你所聽到的。它們會給你非常微妙的反饋。”

11月,Meta前硬件硬件主管Caitlin Kalinowski跳槽到了OpenAI,Kalinowski曾負責了Orion、Ray-Ban Stories等項目。外界有猜測這是OpenAI布局AR眼鏡賽道的舉措之一。

12月,谷歌發(fā)布Gemini 2.0以及最新AI助手Project Astra,在DeepMind官網,智能手機以及智能眼鏡是唯二兩款與Project Astra集成的硬件設備。

國內市場,今年9月,字節(jié)跳動完成對OWS耳機品牌Oladance的收購,傳內部正在開發(fā)AI眼鏡。

今年11月,百度亮相AI眼鏡,也有傳言稱小米正在開發(fā)AI眼鏡產品并計劃于明年發(fā)布。

可以發(fā)現(xiàn),這幾家頭部企業(yè)矛頭所指、寄望于承載未來AI Agent體驗的均為眼鏡設備。那么眼鏡設備的優(yōu)勢在哪里?

在筆者看來,理想的AI硬件需要滿足全天候陪伴、時刻洞察用戶意圖、交流私密等特性,經過這幾個條件篩選,眼鏡、AI耳機、類似Humane Ai Pin的可穿戴設備會是潛在選擇。在這其中,眼鏡是綜合之選,原因在于它兼顧了優(yōu)秀的可穿戴屬性。此外,眼鏡里面還可以進一步添加微顯示屏,以補齊視覺信息傳輸媒介。

當然,從今年市場的新品數(shù)量以及熱度來看,眼鏡已然成為了里面的最大贏家。此前VR陀螺曾統(tǒng)計,截至11月底,公開入局AI眼鏡的數(shù)量已經達到了36家,產品數(shù)量預計超過了50+。此外,在CES期間,我們又可以看到系列AI眼鏡新品的亮相,如Halliday、雷神科技、XPERT等。

不難預見,新的一年當中,VR/AR行業(yè)的一大重要看點是“百鏡大戰(zhàn)”,而在這其中國內的戰(zhàn)況尤為激烈。

Ps:2024可能是眼鏡類產品在命名上最為混亂的一年,去年年初,筆者曾習慣于用智能眼鏡稱呼Ray-Ban Meta這一類不帶屏幕的產品,而AR眼鏡則是帶光學顯示的設備。隨著“AI含金量”日益提升,市場上又衍生出了“智能音頻眼鏡”、“拍攝眼鏡”、“AI眼鏡”、“AI+AR眼鏡”等多個版本。如何讓有關文章不引起歧義,成為了我這一年以來最為頭疼的事情之一。(這里再強調一遍,AI眼鏡指的是搭載AI功能但缺乏顯示的設備,AR眼鏡則在AI眼鏡基礎之上疊加了顯示屏幕)

從當前來看,需不需要為眼鏡引入光學屏幕(此時便成為了AR眼鏡)仍是一個值得探討的問題,原因在于單從市場表現(xiàn)來看,沒有屏幕的眼鏡產品似乎更受歡迎,原因在于它可以更好控制設備外形體積,此外沒有顯示模組價格也可以更友好。

但不可否認的是,從長遠來看,AR眼鏡是AI眼鏡的發(fā)展必然,并且也將是此類產品的最終形態(tài)。在這一年中,海外的Snap以及Meta為AR眼鏡產品打了個樣。

Spectacles 5:雖然該產品只面向開發(fā)者推出,不過產品完成度已經達到了較高水平,眼鏡為一體式形態(tài),運行Snap OS系統(tǒng),支持手勢交互。其他方面,Snap已經推出了AR創(chuàng)作平臺Lens Studio 5.0,并通過與OpenAI合作的方式為眼鏡引入了AI能力。

Spectacles 5,圖源:網絡

Meta Orion:這可能是當前市面上做得最為極致的AR眼鏡,它的重量控制在了100g以內,外形趨近于普通AR眼鏡,并且提供了一整套完備的交互解決方案。在光學選擇上,Meta押注Micro-LED+光波導,基于碳化硅波導將FoV提升到了70°。這款產品代表了Meta長期AR愿景的集中展示,只不過想要在消費市場落地還有一段距離。

Meta Orion,圖源:網絡

 AI+AR:多模態(tài)AI上車,今年關鍵詞會是“端到端”以及記憶能力 

如果在2023年,可能很多人仍會好奇AR眼鏡的使用場景甚至殺手級用例是什么,而到了現(xiàn)在,答案已經逐漸明朗,那便是AI。圍繞AI,今年國內外AR廠商逐漸加碼,類似的報道屢見不鮮:

Meta堅定押注AI大模型并積極提升背后的基礎設施建設,并表示到“到2024年底,我們的目標是擁有350000個NVIDIA H100 GPU”;近期也有消息稱,字節(jié)跳動計劃2025年斥資至多70億美元購買英偉達芯片;而小米集團近期也高調宣布開出千萬年薪挖角AI人才等。

如果從AI應用場景來看,目前的AR眼鏡功能已經逐步趨同,如AI助手已經成為了很多眼鏡產品的標配,這背后能力高低則主要取決于調用的大模型。此外,常見的AI功能還包括提詞翻譯、會議紀要等。

除了常見的功能場景外,這里進一步列舉幾個去年曾出現(xiàn)的AI眼鏡產品的創(chuàng)新用例:

星紀魅族StarV Air2與手機系統(tǒng)打通,如可以實現(xiàn)眼鏡、手機同時雙向顯示翻譯內容等多多端流轉體驗;

Rokid Glasses為盲人打造了基于多模態(tài)AI的無障礙模式;

影目科技INMO Go 2實現(xiàn)了離線翻譯;

閃極「拍拍鏡」A1引入了AI記憶系統(tǒng),可以記住用戶的各種圖像語音信息。

雷鳥V3拍攝眼鏡開發(fā)了AI電臺功能,基于攝像頭識別周圍環(huán)境并同步播放相匹配的音樂。

雷鳥V3拍攝眼鏡的部分創(chuàng)意用例,圖源:雷鳥創(chuàng)新

2024年年初,筆者曾在年度回顧中曾提到了“多模態(tài)AI”將成為AI眼鏡的標配,并預言“AR眼鏡產品的攝像頭將會成為至關重要的模組之一,攝像頭或許會在AR眼鏡上率先落地,其優(yōu)先級甚至會高于光學屏幕。”

現(xiàn)在再來回看,多模態(tài)AI的確成為了AI眼鏡的一大重要賣點,如Ray-Ban Meta于十二月推送了實時人工智能,AI具備了理解實時視頻的能力;而近期發(fā)布的XREAL One雖然表示不盲目跟風AI,但也同樣配備了一顆攝像頭外設以用于多模態(tài)AI拓展。

那么在新的一年中,AI眼鏡又會有何新趨勢?

圖源:星紀魅族

在體驗方面,眼鏡的AI功能上限無疑直接取決于AI大模型的能力上限。這一年以來AI大模型的各項能力屢創(chuàng)新高,早些時候,我們仍多以“專家水平”來評價一款出色的AI大模型,而現(xiàn)在隨著GPT-o3等產品的出現(xiàn),它似乎已經達到了“博士級別”。

對于這類層出不窮的AI大模型,筆者也已經很難用常規(guī)的問題來判別它們AI能力的高低。在這種情況下,我認為AR眼鏡后續(xù)應該卷AI能力包括響應速度、個性化能力等,因為這些指標的提升對于當前用戶感知會更加明顯。

端到端對話。在AI眼鏡興起初期,筆者曾陸陸續(xù)續(xù)體驗了不少同類型產品,當時的痛點主要有幾個,一是調用AI語音電話時手機APP需要在前臺并且無法熄屏,二是AI響應速度太慢,往往長達數(shù)秒,這很容易讓人失去使用的欲望。

去年GPT-4o的發(fā)布無疑是一個重要的轉折,因為它在語音對話方面具有“斷檔式”領先優(yōu)勢,平均響應速度為320ms,對話可以隨時打斷、系統(tǒng)可以理解用戶的情緒語氣,這已經與與人類日常對話體驗十分接近。

這種極低水平的延遲背后得益于模型的端到端訓練,即所有輸入和輸出都由同一個神經網絡處理。今年以來,國內不少廠商其實也看到了端到端AI模型(特別是語音對話式AI)的好處,紛紛展開了相應的研究。如科大訊飛于去年8月發(fā)布的星火極速超擬人交互技術背后應用到了端到端的統(tǒng)一模型框架;而豆包于12月份的火山引擎Force大會上也宣布豆包端到端實時語音模型即將上線。預計在新的一年當中,“端到端”將會成為AR眼鏡更為高頻的詞匯。

圖源:科大訊飛

個性化AI。AI Agent是很多人對于AI的終極幻想,與PC、手機等關注生產力場景的終端不同,AR眼鏡其實更應該滿足我們的陪伴屬性。不過基于筆者對于AR眼鏡類產品的體驗發(fā)現(xiàn),AI在響應用戶需求的時候仍略顯呆板,這是由多方面原因所導致的。

一方面如果我們想要AI更了解我們,那么就需要它對于我們的生活參與更多,如相機、麥克風實時處于響應狀態(tài)等,這對于設備續(xù)航是一個極大的考驗。當然,這背后也涉及到隱私問題。

另一方面,目前AI大模型的“記憶能力”仍是一個稀缺屬性,它們只能機械式記錄特定token數(shù)的上下文信息,因而用戶與之互動過程中會明顯感覺到一種“隔閡”,難以產生體驗黏性。(如果能實現(xiàn)這一點,現(xiàn)如今林林總總的年度報告簡直不值一提。)

好消息是,關于超強記憶AI似乎很快迎來重要突破,微軟AI CEO Mustafa Suleyman早些時候接受采訪時曾提到,微軟正在開發(fā)具有“近乎無限”內存功能的技術。這項進步預計將于2025年實現(xiàn),它將使AI能夠無限期地保留信息,從而改變用戶參與度。

無獨有偶,近日OpenAI CEO Sam Altman公布了公司的新目標,“更好的記憶力,更長的上下文”赫然在列。

圖源:X

功能落地方面,去年年末Meta以及谷歌均展示了帶短暫記憶能力的AI功能體驗,如Ray-Ban Meta可以幫你記住停車位置、搭載Android XR的眼鏡可以幫你記住大門的密碼鎖等。谷歌近期所更新的AI助手Project Astra也以“記憶”作為重要功能之一,據悉可以記住過去互動的背景信息。

Project Astra,圖源:Deepmind

 AI+VR:處理器性能飆升帶來的AI功能拓展 

雖說“AI+眼鏡”是最具想象力的場景,不過對于MR產品而言,AI相關用例也明顯提升。

背后原因可能有兩點,一是AI已經成為一種重要營銷手段,二是去年的拳頭產品,如PICO 4 Ultra、Quest 3S以及Project Moohan等,處理器升級為了驍龍XR2 Gen 2/+處理器,它具備更強的AI算力。以下是部分頭顯產品曾展示的一些AI功能體驗:

Quest 3/3S:今年7月,Meta為頭顯上線了Meta AI,可以通過雙擊手柄的Meta按鈕喚醒。對于支持全彩VST的設備,設備可以實現(xiàn)視覺搜索功能,如詢問花園的植物品種等。

PICO 4 Ultra:內置了AI生成桌面背景、AI 2D抖音短視頻轉3D等玩法。

Project Moohan:配備了與AI深度融合的Android XR系統(tǒng),它在玩法方面相比前兩者更勝一籌,如可以實現(xiàn)系統(tǒng)級響應,實時在線,并支持語音交互以及視覺搜索等。

筆者認為如果在輕度辦公場景下,Project Moohan由于得益于大屏+AI屬性,它的生產力并不一定會弱于目前的PC設備。當然后續(xù)更多功能還有待進一步觀望。

畫圈搜索功能展示,圖源:谷歌

 寫在最后:新一年將繼續(xù)喧囂 

2025年,無疑是“AI+XR”賽道更為熱鬧的一年,對于AI眼鏡,前面提到字節(jié)跳動、小米等巨頭將會進場、Ray-Ban Meta會推出帶屏迭代款;對于AR眼鏡,預計三星、谷歌等廠商會有新品發(fā)布;對于MR頭顯,有傳言稱VIVO將會在這一年入局。

隨著這些新企業(yè)的入局,“AI+XR”新品在價格、功能場景以及品牌影響力等方面都會給市場帶來“巨頭震撼”,市場會經歷一次大浪淘沙。

在筆者看來,今年有兩個值得持續(xù)關注的地方,首先谷歌在去年年末發(fā)布了XR操作系統(tǒng)Android XR,預計今年會有不少品牌“上車”。它的出現(xiàn),有利于降低XR行業(yè)的準入門檻。

此外,筆者認為眼鏡并非“AI載體”的唯一解,新的一年中可能會出現(xiàn)更多全新的終端形態(tài)。

新的一年,讓我們攜手前進。

       原文標題 : 【年度專題】XR終端,能否吃到AI落地的最佳紅利?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號