這家自動(dòng)駕駛公司共標(biāo)記了2億英里的行駛數(shù)據(jù),他們希望業(yè)內(nèi)能數(shù)據(jù)共享
總部位于舊金山的Scale公司是向自動(dòng)駕駛車(chē)輛制造商提供傳感器融合標(biāo)注API(Sensor Fusion Annotation API)的供應(yīng)商,近日他們拿到了千萬(wàn)美元的B輪投資,Lyft、通用汽車(chē)(General Motors)、Zoox、Voyage、nuTonomy和 Embark 都是他們的客戶,Scale的系統(tǒng)目前一共已經(jīng)標(biāo)記了200,000,000英里的自動(dòng)駕駛車(chē)輛的行駛數(shù)據(jù),而他們希望將數(shù)據(jù)開(kāi)源。
隨著機(jī)器視覺(jué)、人臉識(shí)別、語(yǔ)言處理與大數(shù)據(jù)分析等技術(shù)的日臻成熟,出行生態(tài)不斷智能化。計(jì)算機(jī)視覺(jué)為自動(dòng)駕駛汽車(chē)點(diǎn)亮了眼睛,通過(guò)視覺(jué)感知,無(wú)人車(chē)可以標(biāo)注并識(shí)別出車(chē)輛、車(chē)道線以及行人動(dòng)物等。當(dāng)一臺(tái)計(jì)算機(jī)學(xué)習(xí)而不標(biāo)記的訓(xùn)練數(shù)據(jù),它被稱為無(wú)監(jiān)督學(xué)習(xí)。計(jì)算機(jī)通過(guò)無(wú)人監(jiān)督的學(xué)習(xí)得到正確的答案,但它需要很長(zhǎng)時(shí)間需要訓(xùn)練大量的數(shù)據(jù)才能達(dá)到識(shí)別的效果。而當(dāng)計(jì)算機(jī)用標(biāo)記的訓(xùn)練數(shù)據(jù)學(xué)習(xí)時(shí),被稱為監(jiān)督學(xué)習(xí),比如標(biāo)記數(shù)據(jù)是貓的圖像,同時(shí)會(huì)將單詞“cat”作為元數(shù)據(jù)附加到其圖像上,這種方法極大地加速了學(xué)習(xí)過(guò)程。
創(chuàng)建標(biāo)記的訓(xùn)練數(shù)據(jù)的過(guò)程已經(jīng)成為一個(gè)重要且成本高昂的業(yè)務(wù),國(guó)內(nèi)外也有很多創(chuàng)業(yè)公司在做相關(guān)的服務(wù),但這些標(biāo)記數(shù)據(jù)集來(lái)自哪里?
今天的大多數(shù)標(biāo)注數(shù)據(jù)都是人類(lèi)注釋的,成千上萬(wàn)的圖像都是由人工標(biāo)記的,這是一個(gè)非常緩慢而低效的過(guò)程。它需要人坐在計(jì)算機(jī)屏幕前操作注釋器,點(diǎn)擊圖像,逐個(gè)標(biāo)記它們。并且,隨著圖像數(shù)量的增加,這個(gè)過(guò)程會(huì)變得更加昂貴且容易出錯(cuò)。
總部位于舊金山的Scale公司正是向自動(dòng)駕駛車(chē)輛制造商提供傳感器融合標(biāo)注API(Sensor Fusion Annotation API)的供應(yīng)商,以加速數(shù)據(jù)標(biāo)記處理。該公司由麻省理工學(xué)院(MIT)的21歲計(jì)算機(jī)科學(xué)家Alexandr Wang于2016年創(chuàng)立。
Scale的最初目標(biāo)是擴(kuò)展標(biāo)記訓(xùn)練數(shù)據(jù)的過(guò)程。解決這個(gè)問(wèn)題共分為兩個(gè)部分:一個(gè)是編組成千上萬(wàn)人工標(biāo)記數(shù)據(jù)的任務(wù);第二個(gè)是創(chuàng)建一套復(fù)雜的工具,使這些貼標(biāo)機(jī)的效率和準(zhǔn)確度提高了10倍。Alexandr 和他的團(tuán)隊(duì)在創(chuàng)辦兩年來(lái),組建了一支由工程師和技術(shù)人員組成的世界級(jí)技術(shù)團(tuán)隊(duì),正在改變這一領(lǐng)域。當(dāng)?shù)貢r(shí)間8月7日,Scale宣布其融得了由Index Ventures、Accel和Y Combinator領(lǐng)投的1800萬(wàn)美金。
Scale結(jié)合使用了人工數(shù)據(jù)標(biāo)記員和機(jī)器學(xué)習(xí)算法,對(duì)來(lái)自Lyft、通用汽車(chē)(General Motors)、Zoox、Voyage、nuTonomy和 Embark 等客戶的原始、未標(biāo)記的數(shù)據(jù)進(jìn)行分類(lèi),然后以可擴(kuò)展數(shù)據(jù)集的方式返還。該公司的員工負(fù)責(zé)審查來(lái)自汽車(chē)的圖像、雷達(dá)、激光雷達(dá)數(shù)據(jù)(以及其他傳感器數(shù)據(jù)),確保自動(dòng)駕駛車(chē)輛能夠正確識(shí)別道路上的行人、騎自行車(chē)車(chē)手以及其他物體,并且根據(jù)需要進(jìn)行修正。Scale的系統(tǒng)目前一共已經(jīng)標(biāo)記了200,000,000英里的自動(dòng)駕駛車(chē)輛的行駛數(shù)據(jù),并且最近將其工作擴(kuò)展道路機(jī)器人、無(wú)人機(jī)、虛擬助手以及嚴(yán)重依賴AI的“其他解決方案”。
Scale API如何訓(xùn)練自主車(chē)輛
這家初創(chuàng)公司開(kāi)發(fā)了自動(dòng)化系統(tǒng),可以從自動(dòng)駕駛汽車(chē)看到的內(nèi)容中獲取數(shù)據(jù)并對(duì)其進(jìn)行檢查來(lái)標(biāo)記必要的實(shí)物。創(chuàng)建標(biāo)簽的過(guò)程有助于自動(dòng)駕駛汽車(chē)內(nèi)的軟件學(xué)會(huì)識(shí)別特定場(chǎng)景,以便更好地為未來(lái)做好準(zhǔn)備。
Scale 針對(duì)圖像推出一系列注釋類(lèi)型,其發(fā)布的傳感器融合標(biāo)注API(Sensor Fusion Annotation API),能夠支持所有主流傳感器的高級(jí)3D感知,包括激光雷達(dá)(30米內(nèi)稠密3D場(chǎng)景理解)、相機(jī)(70米內(nèi)圖像目標(biāo)識(shí)別)和Radar(150米內(nèi)稀疏場(chǎng)景理解),以幫助汽車(chē)制造商和自動(dòng)駕駛汽車(chē)公司加速感知算法的開(kāi)發(fā)。
在Scale中,提供圖像注釋服務(wù)之一是Cuboid Annotation,它使用包圍汽車(chē),卡車(chē),行人,交通錐等物體的長(zhǎng)方體投影來(lái)注釋二維圖像。通過(guò)一些附加信息,可以將這些二維框注釋轉(zhuǎn)換為完整的三維框,包括高度,寬度,深度,旋轉(zhuǎn)和相對(duì)定位信息。
目前其社區(qū)推出的標(biāo)簽類(lèi)型主要有:
像素方式語(yǔ)義分割
多邊形注釋
點(diǎn)注釋
行注釋
像素方式語(yǔ)義分割
像素方式語(yǔ)義分割
多邊形注釋
線注釋
另外,Scale API還提供用于OCR和圖像轉(zhuǎn)錄、分類(lèi)、比較和數(shù)據(jù)收集的API。
RADAR在150米范圍內(nèi)探測(cè)場(chǎng)景的屏幕截圖
借助傳感器融合標(biāo)注API,用戶可以上傳未標(biāo)記的相機(jī)、激光雷達(dá)和Radar數(shù)據(jù),生成可用于訓(xùn)練3D感知模型的標(biāo)注數(shù)據(jù)。激光雷達(dá)和Radar標(biāo)注是指,采用長(zhǎng)方體包圍特定對(duì)象的3D點(diǎn)云,并得到這些框的位置和大小。該API支持所有用于3D感知的主流傳感器,為自動(dòng)駕駛技術(shù)提供數(shù)據(jù)支持。
手動(dòng)立方體注釋
除了注釋二維圖像,Scale公司也同通過(guò)手工注釋立方體。通過(guò)手動(dòng)立方體調(diào)整,縮放器只需繪制一個(gè)2D框,表示長(zhǎng)方體的一側(cè)和長(zhǎng)方體的另一側(cè):
這通常不是一個(gè)“真正的”長(zhǎng)方體,因?yàn)樗跀?shù)學(xué)上是不精確的!罢嬲摹遍L(zhǎng)方體的正面可能不是一個(gè)完美的90度矩形,特別是如果它沒(méi)有正面朝向相機(jī)。通過(guò)調(diào)整,給定上面的長(zhǎng)方體注釋?zhuān)约耙恍└郊有畔ⅲ聪鄼C(jī)參數(shù)和方向),會(huì)自動(dòng)生成更準(zhǔn)確的注釋?zhuān)?/p>
正面不再是完美的矩形,而是梯形,左邊緣略小,更好地反映了汽車(chē)相機(jī)的相對(duì)方向。右側(cè)的頂部/底部邊緣現(xiàn)在會(huì)聚合到地平線上的一個(gè)點(diǎn)。從3D空間中的這八個(gè)點(diǎn)可以很容易地推斷出所得長(zhǎng)方體的位置,尺寸和方向。通過(guò)這些屬性,人們可以訓(xùn)練模型,從單個(gè)圖像中預(yù)測(cè)類(lèi)似長(zhǎng)方體的物體的3d坐標(biāo)。通過(guò)這種方式,可以創(chuàng)建一個(gè)系統(tǒng),僅需要使用Scale API生成的攝像機(jī)圖像和注釋來(lái)識(shí)別世界上汽車(chē)的位置。
Scale倡導(dǎo)數(shù)據(jù)共享
顯然,標(biāo)記是Scale API的重要業(yè)務(wù)組成部分。正如Wired指出的那樣,錯(cuò)誤地將行人標(biāo)記為車(chē)輛可能會(huì)使自動(dòng)駕駛汽車(chē)的軟件混淆到不斷出錯(cuò)的程度,甚至可能導(dǎo)致事故。Scale已經(jīng)將標(biāo)簽作為開(kāi)發(fā)自動(dòng)駕駛汽車(chē)的必要和不可或缺的一部分。 不幸的是,標(biāo)簽不會(huì)彼此共享。Scale的客戶群包括Cruise,Nuro,Lyft,Zoox,Nutonomy,Starsky Robotics和Embark都將數(shù)據(jù)發(fā)送到Scale這里。但是,這些數(shù)據(jù)并沒(méi)有相互分享,這是一種資源的浪費(fèi)。自動(dòng)駕駛汽車(chē)需要使用更多真實(shí)的標(biāo)記數(shù)據(jù)集測(cè)試來(lái)保證不穩(wěn)定的情況。所以,Scale希望數(shù)據(jù)能夠共享,構(gòu)建更廣泛的數(shù)據(jù)集。
21歲的創(chuàng)始人兼首席執(zhí)行官Alexandr Wang 認(rèn)為“現(xiàn)在,每家公司都在自己的道路上并且保密自己的數(shù)據(jù),實(shí)際上,這些邊緣情況可能需要在整個(gè)行業(yè)中共享或標(biāo)準(zhǔn)化!
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
技術(shù)文庫(kù)
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 【線上直播】新能源汽車(chē)熱管理行業(yè)應(yīng)用新進(jìn)展
-
精彩回顧立即查看>> 【線上直播】西門(mén)子電池行業(yè)研討會(huì)-P4B如何加速電池開(kāi)發(fā)
-
精彩回顧立即查看>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【線下論壇】華邦電子與萊迪思聯(lián)合技術(shù)論壇
推薦專(zhuān)題
-
9
- 1 2025上海車(chē)展看什么?看這一篇就夠了!
- 2 關(guān)稅大戰(zhàn),汽車(chē)芯片會(huì)漲價(jià)嗎
- 3 工信部召開(kāi)智能網(wǎng)聯(lián)汽車(chē)產(chǎn)品準(zhǔn)入及軟件在線升級(jí)管理工作推進(jìn)會(huì)提的內(nèi)容,將如何影響智駕行業(yè)發(fā)展?
- 4 地平線智駕方案軟硬結(jié)合,大眾、保時(shí)捷的合作紛至沓來(lái)
- 5 高呼的“全民智駕”真的做到“全民”了嗎?
- 6 一季度汽車(chē)產(chǎn)量省份排名大洗牌!誰(shuí)在異軍突起?
- 7 奇瑞的混動(dòng)技術(shù):厚積薄發(fā),從發(fā)動(dòng)機(jī)到混動(dòng)系統(tǒng)
- 8 中國(guó)汽車(chē)發(fā)展頂層設(shè)計(jì)思路 - 萬(wàn)鋼主席2025百人會(huì)核心內(nèi)容總結(jié)
- 9 東風(fēng)+華為,還是華為借東風(fēng)?華為ADS3.0技術(shù)詳解
- 10 工信部對(duì)浮躁的智駕說(shuō)“不”
