機(jī)器學(xué)習(xí)在無(wú)人駕駛中的現(xiàn)狀及挑戰(zhàn)
丨機(jī)器學(xué)習(xí)的端對(duì)端控制
當(dāng)然一種應(yīng)用就是針對(duì)我們前面說(shuō)反應(yīng)式的結(jié)構(gòu),假設(shè)整個(gè)控制器我們不管它的內(nèi)部結(jié)構(gòu),完全由一個(gè)神經(jīng)網(wǎng)絡(luò)這樣的程序來(lái)解決,這個(gè)大概就是現(xiàn)在比較端對(duì)端的控制,什么意思?直接從傳感器到車(chē)輛的動(dòng)作,這就是所謂的端對(duì)端的學(xué)習(xí)控制,端對(duì)端本身也不是新鮮的事物,在1989年的時(shí)候美國(guó)機(jī)器人研究所就用當(dāng)時(shí)的三層網(wǎng)絡(luò)就實(shí)現(xiàn)了簡(jiǎn)單的無(wú)人駕駛,因?yàn)楫?dāng)時(shí)的網(wǎng)絡(luò)它的標(biāo)定能力是非常有限的,因此它能夠完成的任務(wù)也是非常簡(jiǎn)單的。
神經(jīng)網(wǎng)絡(luò)大家知道從80年代到90年代甚至到2000年之后很長(zhǎng)一段時(shí)間,發(fā)展是非常非常緩慢的,目前兩種方案,一種是前饋神經(jīng)網(wǎng)絡(luò),一種基于遞歸神經(jīng)網(wǎng)絡(luò),都在做一些研究。
大家可以看到上面這個(gè)視頻,英偉達(dá)在2016年的神經(jīng)網(wǎng)絡(luò)端對(duì)端控制,說(shuō)到這里是不是用端對(duì)端學(xué)習(xí)控制這個(gè)問(wèn)題就解決了,實(shí)際上大家仔細(xì)看是不可能的,前面有一個(gè)十字路口,用端對(duì)端學(xué)習(xí)控制怎么能夠?qū)崿F(xiàn)讓車(chē)選擇不同的路線呢?這個(gè)事情在他做的這個(gè)實(shí)驗(yàn)里面就不涉及到這個(gè)問(wèn)題。
實(shí)際上這個(gè)問(wèn)題英偉達(dá)做這個(gè)實(shí)驗(yàn)還有很多問(wèn)題沒(méi)有解決,從控制上來(lái)說(shuō),車(chē)要適應(yīng)不同的坡路和材質(zhì),這個(gè)本身就是很復(fù)雜的,對(duì)于剛才說(shuō)的端對(duì)端的學(xué)習(xí)控制,要做采集數(shù)據(jù)是非常困難的,而網(wǎng)絡(luò)本身結(jié)構(gòu)也沒(méi)有辦法支持,退而求其次就有其他的研究,大家去看一下Deep Driving:Learning Affordance for Direct Perception in Autonomous Driving 這篇文章,這個(gè)想法就跟這個(gè)端對(duì)端不太一樣,它把這個(gè)系統(tǒng)分為控制和感知,把控制環(huán)節(jié)還是用控制的方法去做,但是后面感知希望用神經(jīng)網(wǎng)絡(luò)來(lái)解決,設(shè)計(jì)一個(gè)神經(jīng)網(wǎng)絡(luò),輸入一個(gè)圖象,輸出就是車(chē)道和車(chē)道上的線得到這樣一個(gè)抽象的模型,把這個(gè)模型再由后端輸入再去控制車(chē)輛運(yùn)動(dòng),這個(gè)是他們展示的一段視頻,這個(gè)是神經(jīng)網(wǎng)絡(luò)的輸入,這個(gè)就是網(wǎng)絡(luò)的輸出,后端控制的輸入,這是他們做的一個(gè)實(shí)驗(yàn)。
這種端對(duì)端的方案,我感覺(jué)下面幾個(gè)問(wèn)題對(duì)他來(lái)說(shuō)可能是比較重要的,最大的問(wèn)題相對(duì)于我們說(shuō)的駕駛?cè)蝿?wù),現(xiàn)有的網(wǎng)絡(luò)結(jié)構(gòu)還是太簡(jiǎn)單了,表達(dá)能力非常有限。
首先我們可以看,從數(shù)據(jù)的意義上來(lái)說(shuō),你要完成一個(gè)駕駛?cè)蝿?wù),你拿到的數(shù)據(jù)有任務(wù)信息,有離線地理信息,有環(huán)境信息還有本體的運(yùn)動(dòng)狀態(tài)等等,對(duì)于這樣一些完全抑制的信息,我們?cè)O(shè)計(jì)一個(gè)什么樣網(wǎng)絡(luò)結(jié)構(gòu)才能綜合起來(lái)實(shí)現(xiàn)車(chē)輛的駕駛,這個(gè)本身我認(rèn)為是一個(gè)比較大的問(wèn)題。第二就是我們選擇困境,在不同的路網(wǎng)里面,你碰到十字路口的到底怎么走,可能很難解決。如果用端對(duì)端的方案可能很難解決這個(gè)問(wèn)題。還有第三個(gè)比如說(shuō)駕駛行為在時(shí)間上的不確定性,實(shí)際上它的復(fù)雜性是非常非常大的,也是現(xiàn)在很難解決的一個(gè)問(wèn)題。這是我們說(shuō)的端對(duì)端的學(xué)習(xí)控制。
丨慎思式結(jié)構(gòu)中的機(jī)器學(xué)習(xí)
我們能不能把機(jī)器學(xué)習(xí)慎思式方案用到無(wú)人駕駛里面去,很多研究用機(jī)器學(xué)習(xí)去提取交通場(chǎng)景中的各種各樣的交通物體,道路環(huán)境等等,用深度神經(jīng)元網(wǎng)絡(luò)實(shí)現(xiàn)場(chǎng)景中的各種交通物體,道路、建筑物的一個(gè)分割,把它作為下一步的決策規(guī)劃的輸入。再比如說(shuō)對(duì)于我們知道現(xiàn)在無(wú)人車(chē)頭上都頂著一個(gè)激光雷達(dá),也可以用深度神經(jīng)原的方法進(jìn)行處理獲取道路上各種各樣的物體,交通標(biāo)志的信息等等。這個(gè)實(shí)際上用深度學(xué)習(xí)在做這種三維微場(chǎng)景分析,這也是目前用深度學(xué)習(xí)來(lái)解決環(huán)境的一個(gè)重要的研究方向。
我們說(shuō)了,可以用它去解決物體的識(shí)別,場(chǎng)景的分析問(wèn)題,當(dāng)然也可以用它解決決策規(guī)劃問(wèn)題。近年來(lái),我覺(jué)得做的比較好的工作就是他們提出的ChauffeurNet,他做的工作就是設(shè)計(jì)一個(gè)非常復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),要來(lái)實(shí)現(xiàn)抑制數(shù)據(jù)的處理融合,這是他們?cè)O(shè)計(jì)的整個(gè)網(wǎng)絡(luò)結(jié)構(gòu),用來(lái)把各種各樣的信息能夠融合到整個(gè)駕駛過(guò)程中去,這是我們說(shuō)的從決策的角度,當(dāng)然也有人研究用機(jī)器學(xué)習(xí)解決控制問(wèn)題。
丨國(guó)防科技大學(xué)無(wú)人駕駛團(tuán)隊(duì)實(shí)踐
現(xiàn)在我們回到我們團(tuán)隊(duì),我們這些年在這方面也做了很多研究工作,我們用學(xué)習(xí)解決車(chē)輛控制,車(chē)輛縱向控制,甚至包括像我們把這個(gè)環(huán)境變成一個(gè)多車(chē)道的模型,實(shí)現(xiàn)無(wú)人車(chē)在環(huán)境里面的自主決策等等,這也是用機(jī)器學(xué)習(xí)做的。我們有兩個(gè)博士生在這一塊做的非常好,一個(gè)是基于廣義Haar濾波器的實(shí)時(shí)目標(biāo)檢測(cè),我們?cè)诳紤]能夠壓縮計(jì)算資源,使得利用十分之一或者五分之一的資源來(lái)實(shí)現(xiàn)同樣類(lèi)似的效果,這對(duì)于機(jī)器學(xué)習(xí)的應(yīng)用應(yīng)該說(shuō)是有非常幫助的。另外我們也做了交通場(chǎng)景的多任務(wù)學(xué)習(xí),什么意思?一個(gè)神經(jīng)網(wǎng)絡(luò)能夠?qū)崿F(xiàn)多個(gè)任務(wù),像今天早上有院士做報(bào)告也說(shuō)到這個(gè)問(wèn)題,對(duì)于人工智能是一個(gè)困難,我們也在做這方面的嘗試,這是我們自己做的實(shí)際的情況,包括物體的分割,行為場(chǎng)景的分割等等。
另外我們?cè)谟洃浭骄W(wǎng)絡(luò),在目標(biāo)檢測(cè)方面的應(yīng)用也做了很多工作。什么意思呢?大家有沒(méi)有注意到,所謂的深度神經(jīng)網(wǎng)絡(luò)往往需要人工去標(biāo)注大量的樣本,這很顯然是很復(fù)雜的工作,我們做的探索是怎么能夠?qū)崿F(xiàn)目標(biāo)檢測(cè),實(shí)現(xiàn)機(jī)器學(xué)習(xí)。這個(gè)如果大家感興趣可以下去關(guān)注一下我們做的工作,應(yīng)該說(shuō)是比較好的,當(dāng)然它的基本原理就是我們首先在靜態(tài)的情況下拍一些視頻。我是在靜態(tài)的環(huán)境、背景下去檢測(cè)動(dòng)態(tài)的目標(biāo),通過(guò)這個(gè)辦法不斷地收集大量的樣本,然后再把學(xué)習(xí)好的檢測(cè)器用在一個(gè)動(dòng)態(tài)的載體上,這是我們已經(jīng)做的一些工作。
最后我說(shuō)一下自己對(duì)這個(gè)事的一點(diǎn)理解:第一說(shuō)我們機(jī)器學(xué)習(xí)對(duì)于解決無(wú)人駕駛的問(wèn)題是非常非常重要的,但是它不是全部,它只能解決其中一部分問(wèn)題。第二深度神經(jīng)網(wǎng)絡(luò)它場(chǎng)景建模與理解的有力工具。第三統(tǒng)計(jì)學(xué)習(xí)、增強(qiáng)學(xué)習(xí)對(duì)于解決行為決策問(wèn)題會(huì)有所幫助,但是目前看來(lái)前提是必須要由人工建立一個(gè)合適的決策模型的基礎(chǔ)上用學(xué)習(xí)的方法來(lái)實(shí)現(xiàn)決策的前件的學(xué)習(xí)。第四是用積極學(xué)習(xí)的方法解決動(dòng)力學(xué)控制問(wèn)題,這個(gè)問(wèn)題按說(shuō)傳統(tǒng)方法已經(jīng)解決比較好了,但是對(duì)于機(jī)器學(xué)習(xí)來(lái)說(shuō),好象沒(méi)有那么簡(jiǎn)單,反而是比較復(fù)雜的問(wèn)題。第五能夠?qū)崿F(xiàn)任務(wù)、本體狀態(tài)、環(huán)境信息并行輸入的網(wǎng)絡(luò)結(jié)構(gòu)應(yīng)該是未來(lái)把機(jī)器學(xué)習(xí)用在無(wú)人駕駛上的一個(gè)研究重點(diǎn)。第六現(xiàn)有的計(jì)算能力仍不足以支持神經(jīng)網(wǎng)絡(luò)在無(wú)人車(chē)中的大規(guī)模應(yīng)用。我的匯報(bào)就到這里,謝謝大家。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 封殺AI“照騙”,“淘寶們”終于不忍了?
- 9 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?
- 10 地平線自動(dòng)駕駛方案解讀