一文了解計(jì)算機(jī)視覺(jué)未來(lái)的走向
前言:
目前,計(jì)算機(jī)視覺(jué)面臨幾大問(wèn)題:
1.需要大算力,需要大數(shù)據(jù)用于訓(xùn)練,因此導(dǎo)致成本太高。
2.應(yīng)用場(chǎng)景單一,目前僅用于無(wú)人駕駛,安防監(jiān)控等少數(shù)領(lǐng)域。
3.對(duì)CV人來(lái)說(shuō),內(nèi)卷嚴(yán)重,市場(chǎng)接近飽和。
在知乎上,很多大牛從技術(shù)的角度上談了關(guān)于計(jì)算機(jī)視覺(jué)未來(lái)的走向,受益匪淺。結(jié)合前幾日看到的另一個(gè)問(wèn)題,為什么很多人現(xiàn)在不看好商湯科技,在這里,我想從一個(gè)社會(huì)的角度來(lái)談一談我對(duì)計(jì)算機(jī)視覺(jué)未來(lái)走向的看法。
日新月異,用它來(lái)形容現(xiàn)在社會(huì)的變化真是再恰當(dāng)不過(guò),而推動(dòng)這個(gè)變化的是科技的高速發(fā)展。
我對(duì)技術(shù)的看法是,技術(shù)必須服務(wù)于人,必須對(duì)社會(huì)有益,推動(dòng)社會(huì)進(jìn)步,而負(fù)責(zé)實(shí)現(xiàn)這件事的正是企業(yè),企業(yè)必須將技術(shù)落地應(yīng)用,變成產(chǎn)品,為人類(lèi)服務(wù),為社會(huì)服務(wù)。
因此,說(shuō)起我為什么不看好商湯科技,是因?yàn)槲矣X(jué)得它沒(méi)有完成這件事。
作為一個(gè)技術(shù)人員,我平?吹臇|西算是比較多,不僅是技術(shù)方面,產(chǎn)品方面也比較關(guān)注。經(jīng)?吹缴虦珪缡烙职l(fā)了什么論文,卻幾乎沒(méi)見(jiàn)過(guò)它們研發(fā)出了什么新產(chǎn)品。在我的印象里,它們就像是一個(gè)研究所的存在。
然而,世界上已經(jīng)有了這么多高校實(shí)驗(yàn)室研究所在搞學(xué)術(shù)研究,還差一個(gè)商湯曠世嗎?
在我看來(lái),這與格力聲稱(chēng)要做格力手機(jī)如出一轍。市面上已經(jīng)有了蘋(píng)果,小米,華為,OV等這么多做的很好的手機(jī),還差一個(gè)格力手機(jī)嗎?
所以董明珠如果要做手機(jī),最合適的就是自己做操作系統(tǒng),或者自己搞芯片,做點(diǎn)對(duì)社會(huì)對(duì)市場(chǎng)有益的事情。但格力明顯沒(méi)有這個(gè)打算,我對(duì)它當(dāng)初說(shuō)要做手機(jī)就一直是冷眼相看。四五年過(guò)去了,就目前來(lái)看,還真沒(méi)看錯(cuò)它。
企業(yè)還是應(yīng)該做企業(yè)該做的事情,那就是將學(xué)術(shù)研究落地應(yīng)用,變成產(chǎn)品。
在《下一個(gè)倒下的會(huì)不會(huì)是華為》中有這樣一段話:
“我們一定要做商人。科學(xué)家可以什么都不管,一輩子只研究蜘蛛腿的一根毛。對(duì)科學(xué)家來(lái)說(shuō),這是可以的。但是對(duì)我們呢?我們只研究蜘蛛腿,誰(shuí)給我們飯吃?因此,不能光研究蜘蛛腿,要研究客戶需求……”
這番話講于2002年,其時(shí),“獅子”朗訊科技快要倒下了,“巨獅”摩托羅拉也病懨懨的……
朗訊科技最核心的資源——貝爾實(shí)驗(yàn)室,正是以研究“蜘蛛腿”“蝴蝶翅膀”“馬尾巴的功能”等這些基礎(chǔ)課題見(jiàn)長(zhǎng)的,它既是朗訊科技的成長(zhǎng)助推器,也是朗訊科技的包袱;摩托羅拉以巨資投入銥星系統(tǒng)研發(fā),結(jié)果尖端技術(shù)成為它走向衰敗的滑鐵盧……這兩家公司以及眾多的“巨獅”都患上了資本和技術(shù)的“富營(yíng)養(yǎng)病”,所以到頭來(lái)都被優(yōu)勢(shì)資源所拖累、所詛咒。
商湯曠世在這一點(diǎn)上像極了朗訊和摩托羅拉,忽視了技術(shù)的最終目的是服務(wù)于人,服務(wù)于社會(huì)。
談及我對(duì)計(jì)算機(jī)視覺(jué)的看法,技術(shù)和產(chǎn)品的關(guān)系就像是硬件與軟件的關(guān)系。當(dāng)硬件發(fā)展到一定水平時(shí),如果軟件的發(fā)展速度跟不上,那么硬件就毫無(wú)作用。當(dāng)軟件發(fā)展起來(lái)后,又受到硬件水平的限制,軟件要進(jìn)一步提高,需要提升硬件水平。
從目前的環(huán)境來(lái)看,學(xué)術(shù)研究已經(jīng)達(dá)到了一定的程度,而落地應(yīng)用的領(lǐng)域或者說(shuō)產(chǎn)品很少,因此導(dǎo)致了計(jì)算機(jī)視覺(jué)的飽和。、
當(dāng)應(yīng)用的領(lǐng)域被逐漸開(kāi)發(fā),產(chǎn)品逐漸增多,現(xiàn)在的飽和就變成了暫時(shí)性的飽和。從產(chǎn)品,市場(chǎng)的層面上也會(huì)進(jìn)一步推動(dòng)學(xué)術(shù)研究的發(fā)展。
那有待開(kāi)發(fā)的領(lǐng)域和產(chǎn)品有哪些呢?
借用何同學(xué)的思考方式,我們對(duì)計(jì)算機(jī)視覺(jué)的應(yīng)用還只局限于當(dāng)下,我們正因?yàn)樗壳靶枰嫶蟮臄?shù)據(jù)集訓(xùn)練,昂貴的算力,才限制了我們對(duì)它的應(yīng)用場(chǎng)景和產(chǎn)品的想象。
當(dāng)日后算力成本降低,數(shù)據(jù)不足的問(wèn)題得到緩解,我們會(huì)發(fā)現(xiàn),其實(shí)計(jì)算機(jī)視覺(jué)可應(yīng)用的場(chǎng)景非常多。
從我的角度來(lái)看,它在未來(lái)一定能與機(jī)器人結(jié)合,我指的機(jī)器人并不只是人形機(jī)器人,主要是各種智能化設(shè)備,如場(chǎng)景監(jiān)控,服務(wù)機(jī)器人,無(wú)人駕駛,醫(yī)療設(shè)備,嵌入式設(shè)備等。
想想很多科幻電影,機(jī)器人可以對(duì)一個(gè)環(huán)境進(jìn)行各種分析,然后做出相應(yīng)行為。當(dāng)然,這對(duì)人類(lèi)來(lái)說(shuō),賦予機(jī)器人電影中的這些能力是一件很可怕的事情,就目前來(lái)說(shuō),也不現(xiàn)實(shí)。
不過(guò),一些小范圍的能力我們是可以給的。
目前已經(jīng)有的一些應(yīng)用是對(duì)監(jiān)控進(jìn)行分析,檢測(cè)到如車(chē)禍,火災(zāi),槍擊案,養(yǎng)老院的老人摔倒等異常事件后自動(dòng)報(bào)警。無(wú)人駕駛上的視覺(jué)。
京東啟動(dòng)一個(gè)對(duì)豬臉識(shí)別的項(xiàng)目,對(duì)豬的健康狀況進(jìn)行檢測(cè),斯坦福對(duì)人的糞便識(shí)別檢測(cè),從而判斷人的健康狀況。
以后可以有以下應(yīng)用:
對(duì)二手車(chē)進(jìn)行全面掃描,識(shí)別型號(hào),給出新舊程度分析,從而給出相應(yīng)報(bào)價(jià)。
對(duì)臉部掃描,分析臉部皮膚情況,給出適合其皮膚的護(hù)理方案。對(duì)頭發(fā)掃描,推薦相應(yīng)的護(hù)發(fā)產(chǎn)品與護(hù)發(fā)方案。
對(duì)農(nóng)田進(jìn)行實(shí)時(shí)監(jiān)控,提醒農(nóng)場(chǎng)主目前農(nóng)田的情況,如蟲(chóng)子,作物生長(zhǎng)狀況,分析該地區(qū)往年氣候,給出對(duì)該地區(qū)農(nóng)田的最優(yōu)打理方案。
家庭服務(wù)機(jī)器人,掃描茶幾沙發(fā),自動(dòng)清理并將物品放到本該在的位置。
學(xué)跳舞,將老師的跳舞輸入作為模板,對(duì)學(xué)生學(xué)舞視頻進(jìn)行分析,給出跳的不對(duì)的地方。
…… ……
還可以有很多很多的應(yīng)用,我給的都是些很細(xì)很具體的想法。
我個(gè)人經(jīng)歷有限,設(shè)想也不夠全面,但我相信社會(huì)上還存在很多可以用視覺(jué)來(lái)解決的事情。
這些事情都需要有一個(gè)共同的基礎(chǔ),就是可以將視覺(jué)用于移動(dòng)端設(shè)備,嵌入式設(shè)備。
從我的理解來(lái)看,日后硬件水平會(huì)有較大發(fā)展,用于深度學(xué)習(xí)的專(zhuān)用處理器會(huì)有較好的性能。因此,計(jì)算機(jī)視覺(jué)未來(lái)的應(yīng)用場(chǎng)景很廣泛,我們需要對(duì)每一個(gè)具體的應(yīng)用場(chǎng)景設(shè)計(jì)一個(gè)很小的,專(zhuān)一的,可以用于嵌入式設(shè)備的模型。模型小型化,輕量化,檢測(cè)實(shí)時(shí)化。
商湯和曠世,作為AI四小龍的一份子,作為一個(gè)企業(yè),將技術(shù)落地應(yīng)用是它們的責(zé)任,不管是從規(guī)模上,人才供給上,資金上,它們也完全有能力去將計(jì)算機(jī)視覺(jué)與機(jī)器人,移動(dòng)端,嵌入式設(shè)備端結(jié)合開(kāi)發(fā)新領(lǐng)域,研發(fā)新產(chǎn)品。
就目前互聯(lián)網(wǎng)企業(yè)來(lái)說(shuō),AI四小龍也是最適合做這件事的。
歡迎關(guān)注公眾號(hào)CV技術(shù)指南。專(zhuān)注于計(jì)算機(jī)視覺(jué)的技術(shù)總結(jié),最新技術(shù)跟蹤。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 封殺AI“照騙”,“淘寶們”終于不忍了?
- 9 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?
- 10 地平線自動(dòng)駕駛方案解讀