訂閱
糾錯
加入自媒體

黃氏定律再次生效,AI算力版圖正越來越大

相比售賣顯卡,英偉達(dá)(NVIDIA)著力點(diǎn)毫無疑問是AI算力。

1965年,得力于對行業(yè)的洞察,戈登·摩爾提出經(jīng)典的摩爾定律,集成電路飛速發(fā)展,人類在信息時代中飛速發(fā)展,隨后誕生了互聯(lián)網(wǎng)浪潮,間接催生了微軟、蘋果、亞馬遜、阿里巴巴、百度等科技公司,也加速了IBM、甲骨文等老牌科技公司的轉(zhuǎn)型。

千禧年后,學(xué)界進(jìn)入“算力解放”世代,集成電路的智慧結(jié)晶“CPU”算力無法完全滿足學(xué)者需要,人工智能算法對算力的支持更強(qiáng)勁、更多元,隨后英偉達(dá)在2006年推出Tesla架構(gòu),借助CUDA系列編程環(huán)境,開啟了AI算力次世代,黃氏定律持續(xù)發(fā)揮作用。

在12月15日開始的2020 GTC中國大會上,英偉達(dá)帶著2020新品NVIDIA A100,繼續(xù)詮釋著“加速計算”的定位。

AI算力與商業(yè)世界的未來

主導(dǎo)未來科技發(fā)展的關(guān)鍵已經(jīng)落在人工智能,場景、數(shù)據(jù)、模型、算力缺一不可。

根據(jù)OpenAI數(shù)據(jù),自2012年以來,AI訓(xùn)練任務(wù)使用的算力呈指數(shù)級增長,每3.5個月翻一倍。科技公司正不斷運(yùn)用AI算法與新商業(yè)模式,推動AI能力滲透個人消費(fèi)市場,底層代表則是算力服務(wù)者英偉達(dá)。

在2020 GTC中國上,英偉達(dá)展示了阿里巴巴淘寶在使用NVIDIA GPU計算平臺下為直播和AI推薦提供加速服務(wù);快手也利用GPU超分辨率處理技術(shù),將視頻分辨率提升至720p或1080p;英偉達(dá)與京東物流基于Jetson平臺打造的智能機(jī)器。

在廣袤的新能源汽車領(lǐng)域,芯片市場更是大有可為。僅在中國市場,中國汽車工程學(xué)會副秘書長葉盛基就預(yù)測2020年中國將銷售130萬輛新能源汽車,其背后涉足的是182.5億美元的AI芯片市場。

相比消費(fèi)級市場,投資者也將目光轉(zhuǎn)向更具成長力、前景更好、更注重運(yùn)用AI技術(shù)的公司身上,其中汽車、大健康與基礎(chǔ)元件是最受關(guān)注的領(lǐng)域。2012-2017年間,中國AI私募投資頻數(shù)以68%的復(fù)合增長率快速增長,其中視覺類、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、語音等技術(shù)應(yīng)用為企業(yè)首選。

盡管在2020年行業(yè)周期變化下,一級市場投資頻數(shù)有所下降,但明顯單筆投資金額在加大,一級市場的投資窗口期即將結(jié)束,同時AI商業(yè)應(yīng)用落地更多,企業(yè)對AI算力的需求也更加渴望。

這一現(xiàn)象同樣體現(xiàn)在二級市場,根據(jù)億歐智庫數(shù)據(jù),截至2020年4月,共有91家從事人工智能技術(shù)開發(fā)與應(yīng)用的中國企業(yè)完成上市。

持續(xù)成長的中國AI市場,讓英偉達(dá)看到比顯卡更大的商業(yè)機(jī)會。

黃氏定律再次生效

在12月15日的GTC大會上,億歐受邀參與了主論壇報道與中國區(qū)媒體溝通會。主論壇上,英偉達(dá)首席科學(xué)家Bill Dally圍繞新架構(gòu)產(chǎn)品A100,分享了AI推理、光追技術(shù)、集群加速以及各個落地產(chǎn)業(yè)的最新支持與應(yīng)用。

作為世界上最大7nm芯片,GPU A100基于Ampere架構(gòu),利用第三代Tensor Core,A100增加了對TF32的支持,可以獲得156 TeraFLOPS(萬億次浮點(diǎn)運(yùn)算每秒)性能,同時MIG技術(shù)可以將A100分解為7個獨(dú)立GPU,而A100本身也支持第三代NVLink與NVSwitch,以集群形式產(chǎn)生更大算力。

英偉達(dá)中國工程和解決方案高級總監(jiān)賴俊杰表示,TF 32是介于FP 16與FP 32之間的中間態(tài),滿足研發(fā)人員與工程師在計算精度與速度的折中,一方面它有足夠的動態(tài)范圍與精度,保證網(wǎng)絡(luò)在訓(xùn)練時沒有任何精度損失,另一方面,利用Tensor Core架構(gòu)提升神經(jīng)網(wǎng)絡(luò)計算性能。

圍繞這款新品,Bill Dally也提到,根據(jù)研究,大多數(shù)神經(jīng)網(wǎng)絡(luò)是可以修剪的,在切斷神經(jīng)元之間70%到90%連接后,精度并不發(fā)生太大變化。

借助結(jié)構(gòu)稀疏,Ampere在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中允許4個權(quán)重中的兩個為0,而在矩陣乘法中,一旦權(quán)重達(dá)成2/4模式,就能額外獲得雙倍性能提升,賴俊杰也表示,在實(shí)測中,神經(jīng)網(wǎng)絡(luò)計算效果也能獲得1.5倍性能提升。

億歐:英偉達(dá)GPU算力持續(xù)大幅提升/英偉達(dá)

英偉達(dá)GPU算力持續(xù)大幅提升/英偉達(dá)

借助架構(gòu)優(yōu)勢,英偉達(dá)集群高性能算力也表現(xiàn)突出。在11月超算TOP 500中,前十名中有8位采用了英偉達(dá)技術(shù),英偉達(dá)Selene在TOP 500和Green 500中都名列第五,而中美歐的頂級超算中都采用了英偉達(dá)的技術(shù)。

Bill Dally認(rèn)為,黃氏定律揭示了推理性能持續(xù)提升的秘密。

從28nm的Kepler、16nm到7nm的Ampere架構(gòu),英偉達(dá)持續(xù)對Tensor Core改進(jìn),不斷優(yōu)化電路設(shè)計與架構(gòu),拋棄傳統(tǒng)集成電路對制程的依賴。在Bill Dally展示中,Ampere架構(gòu)下數(shù)據(jù)中心的推理能力遠(yuǎn)高于競爭對手Intel以及Xilinx,邊緣推理更是遠(yuǎn)超競爭對手。

v2-39982bcd3de937cde223d706c32e2880_1440w.jpg.jpg

v2-06f9713315e4d5cbeed0bb3dcf8b29af_1440w.jpg.jpg

RTXDI效果對比圖/英偉達(dá)

在光追技術(shù)展示中,英偉達(dá)展示了直接照明技術(shù)RTXDI。利用這項(xiàng)技術(shù),圖形界面上每個光源都會將光線投射到相鄰表面上,其支持?jǐn)?shù)百萬個光線,光線在物體表面會發(fā)生多次反射再回到眼睛,借助這項(xiàng)技術(shù),光線效果將更加逼真。

此外,Bill Dally還帶來了DLSS(深度學(xué)習(xí)超級采樣)2.0版本,相比1.0版本,2.0支持圖像更加精確升級,圖像升級后將與更高分辨率實(shí)際渲染的數(shù)據(jù)比較,其中誤差部分會進(jìn)入DGX SuperPODs訓(xùn)練神經(jīng)網(wǎng)絡(luò)loss函數(shù),經(jīng)過數(shù)據(jù)集的特定迭代,準(zhǔn)確展示升級后的圖像。

這一技術(shù)也被用到視頻的升級,利用神經(jīng)網(wǎng)絡(luò),游戲畫面可以顯著提升動態(tài)幀率,同時電影在特效制作中也能基于物理性質(zhì)實(shí)現(xiàn)路徑追蹤,鏡面反射、折射與再折射都可以得到多光線采樣。

相比GPU產(chǎn)品性能展示,英偉達(dá)此次也更加強(qiáng)調(diào)集群計算的支持。

Bill Dally在會上展示了英偉達(dá)MAGNet工具AI推理加速器模擬結(jié)果,其推理能力可以達(dá)到每瓦100 teraops,眾所周知,運(yùn)算中數(shù)據(jù)傳輸帶來的能量損耗最大,MAGNet通過協(xié)調(diào)并控制信息流,最大限度減少數(shù)據(jù)傳輸來達(dá)到節(jié)能效果。

億歐:傳統(tǒng)電氣鏈路與設(shè)計的光鏈路DGX/英偉達(dá)

傳統(tǒng)電氣鏈路與設(shè)計的光鏈路DGX/英偉達(dá)

此外Bill Dally也與技術(shù)團(tuán)隊(duì)研究光鏈路取代電氣鏈路的新技術(shù),采用“密集波分復(fù)用”技術(shù),就有可能在1毫米大小的芯片實(shí)現(xiàn)Tb/s級傳輸,將是現(xiàn)在互連密度的10倍以上。

借助這一吞吐量和NVSwitch技術(shù),Bill Dally和英偉達(dá)計劃未來開發(fā)出依托光鏈路、搭載9排共160個GPU的DGX,這將大幅提升數(shù)據(jù)中心算力。

在軟件方面,全新編程系統(tǒng)原型Legate可以運(yùn)行針對單一GPU編寫的程序,其適用于Jetson Nano、A100以及超算,但目前Legate還無法對大量GPU進(jìn)行理想的并行處理,Bill Dally與技術(shù)團(tuán)隊(duì)仍在優(yōu)化。

英偉達(dá)與中國公司的“!迸c“機(jī)”

在媒體溝通會上,英偉達(dá)GPU計算專家團(tuán)隊(duì)亞太區(qū)總監(jiān)李曦鵬,強(qiáng)調(diào)英偉達(dá)25年來持續(xù)在進(jìn)行“加速計算”。消費(fèi)級市場對英偉達(dá)一直是“顯卡廠商”定位,但從AI算力進(jìn)入主流產(chǎn)學(xué)界后,加速計算這一定位開始充分體現(xiàn)。

億歐:NVIDIA數(shù)據(jù)中心平臺/英偉達(dá)

NVIDIA數(shù)據(jù)中心平臺/英偉達(dá)

除了顯卡產(chǎn)品與新技術(shù)外,英偉達(dá)在大會上用了更多筆墨展示其在數(shù)據(jù)中心以及產(chǎn)業(yè)端的支持,包括第三代的NVLink和NVSwitch等技術(shù)的展望,其中還包括對中小企業(yè)、創(chuàng)業(yè)公司乃至傳統(tǒng)公司的支持。

例如圍繞軟件支持,李曦鵬提到,借助CUDA統(tǒng)一架構(gòu),英偉達(dá)保證了新的應(yīng)用能持續(xù)滿足市場需求,做到了算法、軟件、硬件的相互配合,在本代Ampere架構(gòu)下,TensorFlow有了專門的配套,TensorRT也提供更好的矩陣乘法支撐,甚至還有加速SDK,同時英偉達(dá)也積極投身到應(yīng)用的開發(fā)上,滿足更多企業(yè)或機(jī)構(gòu)“開箱即用”,進(jìn)一步服務(wù)更多B端。

企業(yè)端的表現(xiàn)吸引了眾多中國公司參與,包括阿里巴巴、字節(jié)跳動、中國電信、浪潮、快手等,中國的OEM廠商、云廠商、互聯(lián)網(wǎng)企業(yè)都在利用英偉達(dá)相關(guān)產(chǎn)品與技術(shù)進(jìn)行開發(fā)。

英偉達(dá)醫(yī)療業(yè)務(wù)全球副總裁Kimberly Powell,在15日主論壇圓桌環(huán)節(jié)提到,中國平安、聯(lián)影智能、推想科技和數(shù)坤科技在新冠疫情期間,利用英偉達(dá)GPU產(chǎn)品與技術(shù),加快了影像診斷,為影像診斷提供巨大幫助。

英偉達(dá)亞太區(qū)戰(zhàn)略運(yùn)營與合作伙伴副總裁Ashok Pandey,在圓桌中直接用中文表示,英偉達(dá)與中國云服務(wù)廠商合作已7年,目前頂級的中國云服務(wù)商已經(jīng)推出或即將推出基于A100的新產(chǎn)品,更多AI應(yīng)用也將面向更多云服務(wù)開發(fā)者和使用者。

同時在超算中大放異彩的ARM也將在中國的云、數(shù)據(jù)中心、邊緣計算場景市場中出現(xiàn),英偉達(dá)宣稱,未來ARM的開放度不會受到貿(mào)易管制影響。

英偉達(dá)工程與解決方案高級總監(jiān)李浩南表示,GPU加速的ARM服務(wù)器正在各個場景中夯實(shí),目前在HPC、AI以及游戲中已有表現(xiàn),更多中國公司將加入到ARM陣營。

億歐:2013-2020英偉達(dá)投資布局版圖/億歐商業(yè)分析師趙寧

2013-2020英偉達(dá)投資布局版圖/億歐商業(yè)分析師趙寧

除了產(chǎn)品與技術(shù)市場的合作外,英偉達(dá)過去在全球范圍內(nèi)布局了眾多AI初創(chuàng)公司,本次大會上,12家中國初創(chuàng)公司得到了英偉達(dá)幫助。

在本次GTC大會上,100家初創(chuàng)公司通過“英偉達(dá)初創(chuàng)加速計劃”,在40家投資機(jī)構(gòu)及產(chǎn)業(yè)代表投票中,12家企業(yè)參與了線上展示,涉及領(lǐng)域包括醫(yī)療、零售、消費(fèi)互聯(lián)網(wǎng)、深度學(xué)習(xí)、IoT、工業(yè)制造等領(lǐng)域。

相比過去,英偉達(dá)對于中國市場的重視程度不斷加強(qiáng)。中國是全球AI算力最富集的地區(qū)之一,大量AI與數(shù)字化公司需要更多算力支持,同時中國也是自動駕駛成長最快的市場,以百度Apollo、地平線、馭勢科技、四維圖新等為代表,AI芯片必將是核心需要。

另一方面,目前中國市場占到英偉達(dá)收入一半左右,通過在ARM、Mellanox的布局,英偉達(dá)有了更強(qiáng)的數(shù)據(jù)中心建設(shè)能力,但同時也讓中國客戶不得不購買英偉達(dá)的產(chǎn)品。

超算采購已經(jīng)成為英偉達(dá)核心收入之一,通過外延并購,其完成了對超算產(chǎn)品的嚴(yán)密布局,中國公司進(jìn)入的門檻被大大提高。

換句話說,在服務(wù)器與底層技術(shù)上,中國公司與海外巨頭的競爭差距被資本拉大,知名的OEM廠商看似在生產(chǎn)高附加值的服務(wù)器,但仍處于利潤的微笑曲線底部。

面對英偉達(dá)的橄欖枝,中國公司與市場充滿了機(jī)遇與挑戰(zhàn),下游企業(yè)可以充分享受產(chǎn)品技術(shù)、乃至生態(tài)紅利;英偉達(dá)、AMD、英特爾等半導(dǎo)體巨頭仍占有巨大優(yōu)勢。

這對國產(chǎn)自研的刺激并不低,寒武紀(jì)為代表的中國上市公司會越來越多,從另一個角度而言,這也不失為另一種機(jī)會。

參考資料:

《WIA2020 | 2020全球半導(dǎo)體芯片科技創(chuàng)新TOP50》,億歐智庫,何少佳,2020年12月9日

《2020年中國人工智能商業(yè)落地研究報告》,億歐智庫,張一豪,2020年7月10日

作者:黃志磊    

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號