123,123,123

<sub id="6qqxw"></sub>

^{<style id="6qqxw"></style>}

當(dāng)前位置： OFweek 智能汽車網(wǎng) > 自動駕駛 > 正文

Waymo無人車啟用DeepMind異步優(yōu)化方法，提高傳感器識別效率

2019-07-29 10:48

自動駕駛車輛采用神經(jīng)網(wǎng)絡(luò)來執(zhí)行許多駕駛?cè)蝿?wù)，從檢測物體和預(yù)測其他人的行為方式，到規(guī)劃汽車的下一步動作。一般情況下，訓(xùn)練單獨的神經(jīng)網(wǎng)絡(luò)需要數(shù)周的微調(diào)和實驗，以及大量的算力�，F(xiàn)在，Waymo與DeepMind的研究合作，從達(dá)爾文對進(jìn)化論中汲取靈感，使這項訓(xùn)練更加有效和高效。

神經(jīng)網(wǎng)絡(luò)的性能受訓(xùn)練方案的影響非常大，主要思路就是找到最優(yōu)學(xué)習(xí)率、讓神經(jīng)網(wǎng)絡(luò)在每次迭代后變得更好，但性能波動不需要太大。

尋找最佳訓(xùn)練方案（或“超參數(shù)方案”）通常是通過工程師的經(jīng)驗和直覺，或通過廣泛的搜索來實現(xiàn)的。在隨機搜索中，研究人員在多種類型的超參數(shù)上應(yīng)用了許多隨機超參數(shù)調(diào)度，以便獨立地并行地訓(xùn)練不同的網(wǎng)絡(luò) ，然后可以選擇性能最佳的模型。

因為并行訓(xùn)練大量模型在計算上是昂貴的，所以研究人員通常通過在訓(xùn)練期間監(jiān)視網(wǎng)絡(luò)，手動調(diào)整隨機搜索，定期剔除最弱表現(xiàn)的運算并釋放資源，以從頭開始用新的隨機超參數(shù)訓(xùn)練新網(wǎng)絡(luò)。這種類型的手動調(diào)整可以更快地產(chǎn)生更好的結(jié)果，但這是非常耗費人力的。

為了提高這一過程的效率，DeepMind 的研究人員設(shè)計了一種基于進(jìn)化競爭（PBT）自動確定良好超參數(shù)調(diào)度的方法，該方案結(jié)合了手動調(diào)整和隨機搜索的優(yōu)點。

基于PBT模型如何運作：

PBT的工作原理是同時啟動許多超參數(shù)搜索，并定期進(jìn)行“競爭”以比較模型的性能。從訓(xùn)練池中刪除失敗的模型，并且僅使用獲勝模型繼續(xù)訓(xùn)練，使用稍微突變的超參數(shù)更新。

PBT比研究人員采用的傳統(tǒng)方法更有效，例如隨機搜索，因為每個新的神經(jīng)網(wǎng)絡(luò)都繼承了其父網(wǎng)絡(luò)的完整狀態(tài)，并且不需要從一開始就重新開始訓(xùn)練。此外，超參數(shù)不是靜態(tài)的，而是在整個培訓(xùn)過程中積極更新。與隨機搜索相比，PBT將更多的資源培訓(xùn)用于成功的超參數(shù)值。

實驗取得了不錯的進(jìn)展，PBT算法不僅實現(xiàn)了更高的精度，并且減少24％的誤報、保持了較高的召回率。

同時，PBT還節(jié)省了時間和資源。通過PBT訓(xùn)練的網(wǎng)絡(luò)，時間和資源只有原來的一半。24％的誤報，同時也能保持較高的召回率。此外，PBT所需的訓(xùn)練時間和計算資源僅為原來的一半。

現(xiàn)在，Waymo 已將 PBT 納入了技術(shù)基礎(chǔ)設(shè)施中，研究人員點點按鈕就能應(yīng)用該算法，DeepMind 每隔 15 分鐘就會對模型進(jìn)行一次評估，以讓測試結(jié)果更準(zhǔn)確。

這是Waymo第一次曝光的與DeepMind在網(wǎng)絡(luò)上的合作，然而這種異步優(yōu)化的PBT方法其實早就出現(xiàn)了。

它在Multi－Agent或者并行訓(xùn)練中被提到過，甚至在DeepMind 星際爭霸II里的AlphaStar中都使用了該方法。主要用來自適應(yīng)調(diào)節(jié)超參數(shù)。打破了通常的深度學(xué)習(xí)，超參數(shù)都是憑經(jīng)驗預(yù)先設(shè)計好的，會花費大量精力且不一定有好的效果，特別是在深度強化學(xué)習(xí)這種非靜態(tài)（non－stationary）的環(huán)境中，要想得到SOTA效果，超參數(shù)還應(yīng)隨著環(huán)境變化而自適應(yīng)調(diào)整，比如探索率等等。這種基于種群（population）的進(jìn)化方式，淘汰差的模型，利用（exploit）好的模型并添加隨機擾動（explore）進(jìn)一步優(yōu)化，最終得到最優(yōu)的模型。

有學(xué)者曾分別從強化學(xué)習(xí)，監(jiān)督學(xué)習(xí)，GAN三個方面做實驗，論證了這個簡單但有效的算法。

與其他領(lǐng)域不同的是，自動駕駛會涉及人身安全，所以應(yīng)用起來不像博弈游戲一樣隨便，通過競爭篩選模型是一個優(yōu)勢，但同樣也可能是個劣勢，需要提供足夠的種群才能讓篩選出的網(wǎng)絡(luò)結(jié)構(gòu)變得意義。

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報。

發(fā)表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

行業(yè)報告

2025年激光雷達(dá)應(yīng)用市場調(diào)研及前景預(yù)測報告
2025年中國光電傳感器市場發(fā)展現(xiàn)狀及投資前景分析
2025年中國汽車電子行業(yè)市場發(fā)展現(xiàn)狀及投資前景分析
2025年新能源汽車充電樁市場分析報告

最新發(fā)布

最新活動更多

3月6日
立即預(yù)約>> 【在線直播】可視化神器！VisionSym 賦能汽車光學(xué)原型開發(fā)
精彩回顧
立即查看>> 12月16-17日 AMD 嵌入式峰會
精彩回顧
立即查看>> 恩智浦創(chuàng)新技術(shù)峰會
精彩回顧
立即查看>> 【工程師系列】汽車電子技術(shù)在線大會
精彩回顧
立即查看>> Works With 開發(fā)者大會深圳站
精彩回顧
立即查看>> 【限時福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站

一周熱點月點擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報告

智能汽車網(wǎng) 獵頭職位更多

硬件開發(fā)工程師（前裝汽車電子）深圳奧尼電子股份有限公司
產(chǎn)品工程師（汽車）易思維（杭州）科技股份有限公司
（汽車）PQE工程師廣東和勝新能源科技有限公司

高級軟件工程師廣東省/深圳市
自動化高級工程師廣東省/深圳市
光器件研發(fā)工程師福建省/福州市
銷售總監(jiān)（光器件）北京市/海淀區(qū)
激光器高級銷售經(jīng)理上海市/虹口區(qū)
光器件物理工程師北京市/海淀區(qū)
激光研發(fā)工程師北京市/昌平區(qū)
技術(shù)專家廣東省/江門市
封裝工程師北京市/海淀區(qū)
結(jié)構(gòu)工程師廣東省/深圳市

文章糾錯

x

_*文字標(biāo)題：

_*糾錯內(nèi)容：

聯(lián)系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網(wǎng)安備 44030502002758號

感谢您访问我们的网站，您可能还对以下资源感兴趣：

久久人妻av无码中文字幕

m3u8午夜福利一区二区三区久久久精产国品一产二产三产区中文字幕在线一级av片久久精品国产亚洲AV电影网

<small id="54aeg"><tbody id="54aeg"></tbody></small>

<noscript id="54aeg"></noscript>