商湯絕影CEO王曉剛:智能駕駛與智能座艙的發(fā)展路徑
在車展前的商湯絕影媒體溝通會(huì)上,商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家、商湯絕影CEO王曉剛深入探討了輔助駕駛與智能座艙的未來(lái)發(fā)展方向。
● 輔助駕駛正邁向生成式智能輔助駕駛階段,世界模型與強(qiáng)化學(xué)習(xí)的結(jié)合將突破人類駕駛行為的局限,提升安全性和確定性。
● 智能座艙通過(guò)引入深度思考能力和多模態(tài)交互,致力于打造“家庭新成員”體驗(yàn),打破體驗(yàn)同質(zhì)化。
我們將從自動(dòng)駕駛和智能座艙兩個(gè)維度,結(jié)合王曉剛的觀點(diǎn),分析技術(shù)趨勢(shì)、行業(yè)挑戰(zhàn)及商湯絕影的戰(zhàn)略布局,展望智能汽車產(chǎn)業(yè)的未來(lái)。
01
輔助駕駛:
從端到端到生成式
智能駕駛的躍遷
輔助駕駛技術(shù)經(jīng)歷了從基于物理模型的規(guī)則階段到端到端數(shù)據(jù)驅(qū)動(dòng)階段的轉(zhuǎn)變。
端到端模型通過(guò)輸入圖像和視頻直接預(yù)測(cè)車輛行駛軌跡,模仿人類駕駛行為。這一模式高度依賴數(shù)據(jù)量和質(zhì)量,尤其在復(fù)雜場(chǎng)景中,優(yōu)質(zhì)數(shù)據(jù)稀缺。
例如,90%的駕駛者在困難場(chǎng)景中可能選擇停車,僅1%-10%的高水平數(shù)據(jù)具有學(xué)習(xí)價(jià)值,端到端模型存在不確定性:特定問(wèn)題場(chǎng)景難以復(fù)現(xiàn),模型更新后可能導(dǎo)致已解決場(chǎng)景的性能回退,統(tǒng)計(jì)性結(jié)果與自動(dòng)駕駛對(duì)安全性和確定性的高要求相悖。
輔助駕駛的下一階段是“生成式智能駕駛”,核心在于世界模型與強(qiáng)化學(xué)習(xí)的協(xié)同。
世界模型通過(guò)3D重建和物理建模,精準(zhǔn)模擬現(xiàn)實(shí)世界的物理定律、交通規(guī)則和運(yùn)動(dòng)規(guī)律,構(gòu)建類似圍棋棋盤的“虛擬環(huán)境”,強(qiáng)化學(xué)習(xí)通過(guò)反復(fù)模擬問(wèn)題場(chǎng)景,優(yōu)化端到端模型,解決特定場(chǎng)景問(wèn)題并實(shí)現(xiàn)泛化,突破了人類駕駛行為的上限,還降低了數(shù)據(jù)采集的成本和風(fēng)險(xiǎn)。
商湯絕影的“開(kāi)悟”世界模型已取得顯著成果,連續(xù)兩年在Waymo挑戰(zhàn)賽中奪冠。
2023年11月發(fā)布的1.0版本覆蓋多種場(chǎng)景,2025年升級(jí)至2.0,進(jìn)一步結(jié)合強(qiáng)化學(xué)習(xí),形成云端與端側(cè)協(xié)同的新范式,通過(guò)云端訓(xùn)練大模型并蒸餾至車端,適應(yīng)不同算力水平的芯片架構(gòu),云端研發(fā)的比重將持續(xù)增加,算力中心等基礎(chǔ)設(shè)施將成為競(jìng)爭(zhēng)關(guān)鍵。
生成式智能輔助駕駛依賴云端訓(xùn)練,但車端算力需求依然重要,算力與模型應(yīng)對(duì)復(fù)雜場(chǎng)景的能力呈正比。然而,類似DeepSeek的MOE(混合專家模型)架構(gòu)通過(guò)優(yōu)化參數(shù)激活,顯著降低算力需求。
這種技術(shù)路線對(duì)車端部署大模型具有普適意義。商湯絕影通過(guò)MOE架構(gòu)和工程化優(yōu)化,在有限算力下實(shí)現(xiàn)高性能模型部署,為量產(chǎn)落地提供了可行路徑。
針對(duì)地平線創(chuàng)始人余凱“99%人類數(shù)據(jù)不值得學(xué)習(xí)”的觀點(diǎn),王曉剛表示認(rèn)同其部分邏輯。
在端到端范式下,人類駕駛數(shù)據(jù)多為簡(jiǎn)單場(chǎng)景,信息量低,而復(fù)雜場(chǎng)景數(shù)據(jù)質(zhì)量參差不齊。通過(guò)世界模型和仿真,商湯絕影能夠重復(fù)問(wèn)題場(chǎng)景并生成多樣化數(shù)據(jù),提升模型的確定性和安全性。
量產(chǎn)過(guò)程中,商湯結(jié)合自有采集數(shù)據(jù)與世界模型生成數(shù)據(jù),迭代優(yōu)化模型質(zhì)量,確保時(shí)空一致性和場(chǎng)景多樣性。
輔助駕駛安全性的提升離不開(kāi)艙駕融合和駕駛員監(jiān)控系統(tǒng)(DMS),DMS不僅需監(jiān)測(cè)駕駛員狀態(tài)(如疲勞、分心),還需通過(guò)3D視線追蹤(Gaze)精準(zhǔn)判斷其關(guān)注目標(biāo)。
在無(wú)保護(hù)左轉(zhuǎn)場(chǎng)景中,DMS可確認(rèn)駕駛員是否關(guān)注潛在風(fēng)險(xiǎn)車輛,從而決定采取激進(jìn)或保守的駕駛策略。商湯通過(guò)與廣汽、奇瑞、東風(fēng)一汽等車企合作,量產(chǎn)J6M智駕方案和端到端智駕方案,進(jìn)一步驗(yàn)證技術(shù)可靠性。
02
智能座艙:
從工具到家庭成員的體驗(yàn)升級(jí)
DeepSeek通過(guò)強(qiáng)化學(xué)習(xí)和思維鏈生成超越人類知識(shí)的數(shù)據(jù),打破了語(yǔ)言模型的Scaling Law瓶頸,其表達(dá)生動(dòng)幽默,深受行業(yè)關(guān)注。
直接將DeepSeek接入座艙并不適合,座艙交互場(chǎng)景要求簡(jiǎn)潔高效,冗長(zhǎng)的推理過(guò)程和中間結(jié)果不適用于車內(nèi)環(huán)境。
商湯絕影基于DeepSeek的核心技術(shù),優(yōu)化SenseAuto-chat模型,結(jié)合多模態(tài)推理,打造“一句話頂一萬(wàn)句”的交互體驗(yàn),賦予座艙“有趣的靈魂”。智能座艙的同質(zhì)化問(wèn)題日益凸顯,傳統(tǒng)語(yǔ)言助手在交互能力上缺乏本質(zhì)提升。
● 商湯絕影提出“家庭新成員”理念,將座艙從問(wèn)答工具、功能助手升級(jí)為情感共情的伙伴。具體體現(xiàn)在以下技術(shù)突破:
◎ 無(wú)注冊(cè)人臉識(shí)別與記憶生成:通過(guò)對(duì)話自動(dòng)推斷用戶身份并記住面孔,結(jié)合互聯(lián)網(wǎng)信息和交互歷史生成個(gè)性化記憶,形成長(zhǎng)期共情。例如,機(jī)器人可根據(jù)用戶近期活動(dòng)主動(dòng)發(fā)起話題,縮短人車距離。◎ 免喚醒多人多輪對(duì)話:機(jī)器人時(shí)刻監(jiān)聽(tīng)多人對(duì)話,理解上下文并主動(dòng)參與討論,甚至化解矛盾,提供情感調(diào)和。這種能力適配座艙多人交互場(chǎng)景,顯著提升沉浸感。◎ 深度思考與多模態(tài)推理:商湯日日新6.0模型將DeepSeek的深度思考能力引入多模態(tài),結(jié)合視覺(jué)、語(yǔ)音等多維輸入,生成精準(zhǔn)幽默的表達(dá)。
商湯絕影發(fā)布行業(yè)首個(gè)車載AI OS基礎(chǔ)設(shè)施“絕影千機(jī)”,核心為AI內(nèi)核,包含多模態(tài)模型、記憶功能、MOE架構(gòu)和全時(shí)運(yùn)行能力,商湯聚焦AI相關(guān)技術(shù),與車企OS結(jié)合形成完整AI操作系統(tǒng),并引入第三方智能體構(gòu)建生態(tài)。
MOE架構(gòu)適配低算力芯片,支持從0.幾B到幾十B的模型部署,確保高效體驗(yàn)。
● 商湯通過(guò)3D視線追蹤、健康監(jiān)測(cè)(心跳、血氧、血壓)等技術(shù),拓展座艙功能。
◎ 3D Gaze可識(shí)別駕駛員注視的車外目標(biāo),支持自動(dòng)繳費(fèi)、拍照分享等創(chuàng)新應(yīng)用;
◎ 健康監(jiān)測(cè)則提供主動(dòng)關(guān)懷和安全預(yù)警,進(jìn)一步融合艙駕功能。
在國(guó)內(nèi)市場(chǎng)高度內(nèi)卷的背景下,商湯絕影積極配合車企出海,滿足2026年ENCAP對(duì)DMS和OMS的強(qiáng)制要求。
2024年,商湯已協(xié)助車企實(shí)現(xiàn)ENCAP最高分,未來(lái)將深化與合資和全球品牌合作,抓住海外市場(chǎng)對(duì)高階智駕和智能座艙的需求增長(zhǎng)。
小結(jié)
商湯絕影的戰(zhàn)略布局展現(xiàn)了其對(duì)自動(dòng)駕駛和智能座艙的深刻洞察,輔助駕駛領(lǐng)域,生成式智能駕駛通過(guò)世界模型和強(qiáng)化學(xué)習(xí)突破數(shù)據(jù)瓶頸,提升安全性和確定性;在智能座艙領(lǐng)域,“家庭新成員”理念以深度思考和多模態(tài)交互為核心,打破同質(zhì)化壁壘。
商湯通過(guò)AI內(nèi)核和操作系統(tǒng)生態(tài)建設(shè),聯(lián)合車企推動(dòng)技術(shù)落地,同時(shí)積極布局海外市場(chǎng),應(yīng)對(duì)全球合規(guī)需求。
原文標(biāo)題 : 商湯絕影CEO王曉剛:智能駕駛與智能座艙的發(fā)展路徑
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
技術(shù)文庫(kù)
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 【線上直播】新能源汽車熱管理行業(yè)應(yīng)用新進(jìn)展
-
精彩回顧立即查看>> 【線上直播】西門子電池行業(yè)研討會(huì)-P4B如何加速電池開(kāi)發(fā)
-
精彩回顧立即查看>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【線下論壇】華邦電子與萊迪思聯(lián)合技術(shù)論壇
- 1 2025上海車展看什么?看這一篇就夠了!
- 2 關(guān)稅大戰(zhàn),汽車芯片會(huì)漲價(jià)嗎
- 3 工信部召開(kāi)智能網(wǎng)聯(lián)汽車產(chǎn)品準(zhǔn)入及軟件在線升級(jí)管理工作推進(jìn)會(huì)提的內(nèi)容,將如何影響智駕行業(yè)發(fā)展?
- 4 地平線智駕方案軟硬結(jié)合,大眾、保時(shí)捷的合作紛至沓來(lái)
- 5 高呼的“全民智駕”真的做到“全民”了嗎?
- 6 一季度汽車產(chǎn)量省份排名大洗牌!誰(shuí)在異軍突起?
- 7 奇瑞的混動(dòng)技術(shù):厚積薄發(fā),從發(fā)動(dòng)機(jī)到混動(dòng)系統(tǒng)
- 8 東風(fēng)+華為,還是華為借東風(fēng)?華為ADS3.0技術(shù)詳解
- 9 工信部對(duì)浮躁的智駕說(shuō)“不”
- 10 重要信號(hào)!奇瑞汽車IPO背后大佬現(xiàn)身海信集團(tuán)