黃氏定律再次生效,AI算力版圖正越來越大
相比售賣顯卡,英偉達(dá)(NVIDIA)著力點(diǎn)毫無疑問是AI算力。
1965年,得力于對行業(yè)的洞察,戈登·摩爾提出經(jīng)典的摩爾定律,集成電路飛速發(fā)展,人類在信息時代中飛速發(fā)展,隨后誕生了互聯(lián)網(wǎng)浪潮,間接催生了微軟、蘋果、亞馬遜、阿里巴巴、百度等科技公司,也加速了IBM、甲骨文等老牌科技公司的轉(zhuǎn)型。
千禧年后,學(xué)界進(jìn)入“算力解放”世代,集成電路的智慧結(jié)晶“CPU”算力無法完全滿足學(xué)者需要,人工智能算法對算力的支持更強(qiáng)勁、更多元,隨后英偉達(dá)在2006年推出Tesla架構(gòu),借助CUDA系列編程環(huán)境,開啟了AI算力次世代,黃氏定律持續(xù)發(fā)揮作用。
在12月15日開始的2020 GTC中國大會上,英偉達(dá)帶著2020新品NVIDIA A100,繼續(xù)詮釋著“加速計算”的定位。
AI算力與商業(yè)世界的未來
主導(dǎo)未來科技發(fā)展的關(guān)鍵已經(jīng)落在人工智能,場景、數(shù)據(jù)、模型、算力缺一不可。
根據(jù)OpenAI數(shù)據(jù),自2012年以來,AI訓(xùn)練任務(wù)使用的算力呈指數(shù)級增長,每3.5個月翻一倍。科技公司正不斷運(yùn)用AI算法與新商業(yè)模式,推動AI能力滲透個人消費(fèi)市場,底層代表則是算力服務(wù)者英偉達(dá)。
在2020 GTC中國上,英偉達(dá)展示了阿里巴巴淘寶在使用NVIDIA GPU計算平臺下為直播和AI推薦提供加速服務(wù);快手也利用GPU超分辨率處理技術(shù),將視頻分辨率提升至720p或1080p;英偉達(dá)與京東物流基于Jetson平臺打造的智能機(jī)器。
在廣袤的新能源汽車領(lǐng)域,芯片市場更是大有可為。僅在中國市場,中國汽車工程學(xué)會副秘書長葉盛基就預(yù)測2020年中國將銷售130萬輛新能源汽車,其背后涉足的是182.5億美元的AI芯片市場。
相比消費(fèi)級市場,投資者也將目光轉(zhuǎn)向更具成長力、前景更好、更注重運(yùn)用AI技術(shù)的公司身上,其中汽車、大健康與基礎(chǔ)元件是最受關(guān)注的領(lǐng)域。2012-2017年間,中國AI私募投資頻數(shù)以68%的復(fù)合增長率快速增長,其中視覺類、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、語音等技術(shù)應(yīng)用為企業(yè)首選。
盡管在2020年行業(yè)周期變化下,一級市場投資頻數(shù)有所下降,但明顯單筆投資金額在加大,一級市場的投資窗口期即將結(jié)束,同時AI商業(yè)應(yīng)用落地更多,企業(yè)對AI算力的需求也更加渴望。
這一現(xiàn)象同樣體現(xiàn)在二級市場,根據(jù)億歐智庫數(shù)據(jù),截至2020年4月,共有91家從事人工智能技術(shù)開發(fā)與應(yīng)用的中國企業(yè)完成上市。
持續(xù)成長的中國AI市場,讓英偉達(dá)看到比顯卡更大的商業(yè)機(jī)會。
黃氏定律再次生效
在12月15日的GTC大會上,億歐受邀參與了主論壇報道與中國區(qū)媒體溝通會。主論壇上,英偉達(dá)首席科學(xué)家Bill Dally圍繞新架構(gòu)產(chǎn)品A100,分享了AI推理、光追技術(shù)、集群加速以及各個落地產(chǎn)業(yè)的最新支持與應(yīng)用。
作為世界上最大7nm芯片,GPU A100基于Ampere架構(gòu),利用第三代Tensor Core,A100增加了對TF32的支持,可以獲得156 TeraFLOPS(萬億次浮點(diǎn)運(yùn)算每秒)性能,同時MIG技術(shù)可以將A100分解為7個獨(dú)立GPU,而A100本身也支持第三代NVLink與NVSwitch,以集群形式產(chǎn)生更大算力。
英偉達(dá)中國工程和解決方案高級總監(jiān)賴俊杰表示,TF 32是介于FP 16與FP 32之間的中間態(tài),滿足研發(fā)人員與工程師在計算精度與速度的折中,一方面它有足夠的動態(tài)范圍與精度,保證網(wǎng)絡(luò)在訓(xùn)練時沒有任何精度損失,另一方面,利用Tensor Core架構(gòu)提升神經(jīng)網(wǎng)絡(luò)計算性能。
圍繞這款新品,Bill Dally也提到,根據(jù)研究,大多數(shù)神經(jīng)網(wǎng)絡(luò)是可以修剪的,在切斷神經(jīng)元之間70%到90%連接后,精度并不發(fā)生太大變化。
借助結(jié)構(gòu)稀疏,Ampere在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中允許4個權(quán)重中的兩個為0,而在矩陣乘法中,一旦權(quán)重達(dá)成2/4模式,就能額外獲得雙倍性能提升,賴俊杰也表示,在實(shí)測中,神經(jīng)網(wǎng)絡(luò)計算效果也能獲得1.5倍性能提升。
英偉達(dá)GPU算力持續(xù)大幅提升/英偉達(dá)
借助架構(gòu)優(yōu)勢,英偉達(dá)集群高性能算力也表現(xiàn)突出。在11月超算TOP 500中,前十名中有8位采用了英偉達(dá)技術(shù),英偉達(dá)Selene在TOP 500和Green 500中都名列第五,而中美歐的頂級超算中都采用了英偉達(dá)的技術(shù)。
Bill Dally認(rèn)為,黃氏定律揭示了推理性能持續(xù)提升的秘密。
從28nm的Kepler、16nm到7nm的Ampere架構(gòu),英偉達(dá)持續(xù)對Tensor Core改進(jìn),不斷優(yōu)化電路設(shè)計與架構(gòu),拋棄傳統(tǒng)集成電路對制程的依賴。在Bill Dally展示中,Ampere架構(gòu)下數(shù)據(jù)中心的推理能力遠(yuǎn)高于競爭對手Intel以及Xilinx,邊緣推理更是遠(yuǎn)超競爭對手。
RTXDI效果對比圖/英偉達(dá)
在光追技術(shù)展示中,英偉達(dá)展示了直接照明技術(shù)RTXDI。利用這項(xiàng)技術(shù),圖形界面上每個光源都會將光線投射到相鄰表面上,其支持?jǐn)?shù)百萬個光線,光線在物體表面會發(fā)生多次反射再回到眼睛,借助這項(xiàng)技術(shù),光線效果將更加逼真。
此外,Bill Dally還帶來了DLSS(深度學(xué)習(xí)超級采樣)2.0版本,相比1.0版本,2.0支持圖像更加精確升級,圖像升級后將與更高分辨率實(shí)際渲染的數(shù)據(jù)比較,其中誤差部分會進(jìn)入DGX SuperPODs訓(xùn)練神經(jīng)網(wǎng)絡(luò)loss函數(shù),經(jīng)過數(shù)據(jù)集的特定迭代,準(zhǔn)確展示升級后的圖像。
這一技術(shù)也被用到視頻的升級,利用神經(jīng)網(wǎng)絡(luò),游戲畫面可以顯著提升動態(tài)幀率,同時電影在特效制作中也能基于物理性質(zhì)實(shí)現(xiàn)路徑追蹤,鏡面反射、折射與再折射都可以得到多光線采樣。
相比GPU產(chǎn)品性能展示,英偉達(dá)此次也更加強(qiáng)調(diào)集群計算的支持。
Bill Dally在會上展示了英偉達(dá)MAGNet工具AI推理加速器模擬結(jié)果,其推理能力可以達(dá)到每瓦100 teraops,眾所周知,運(yùn)算中數(shù)據(jù)傳輸帶來的能量損耗最大,MAGNet通過協(xié)調(diào)并控制信息流,最大限度減少數(shù)據(jù)傳輸來達(dá)到節(jié)能效果。
傳統(tǒng)電氣鏈路與設(shè)計的光鏈路DGX/英偉達(dá)
此外Bill Dally也與技術(shù)團(tuán)隊(duì)研究光鏈路取代電氣鏈路的新技術(shù),采用“密集波分復(fù)用”技術(shù),就有可能在1毫米大小的芯片實(shí)現(xiàn)Tb/s級傳輸,將是現(xiàn)在互連密度的10倍以上。
借助這一吞吐量和NVSwitch技術(shù),Bill Dally和英偉達(dá)計劃未來開發(fā)出依托光鏈路、搭載9排共160個GPU的DGX,這將大幅提升數(shù)據(jù)中心算力。
在軟件方面,全新編程系統(tǒng)原型Legate可以運(yùn)行針對單一GPU編寫的程序,其適用于Jetson Nano、A100以及超算,但目前Legate還無法對大量GPU進(jìn)行理想的并行處理,Bill Dally與技術(shù)團(tuán)隊(duì)仍在優(yōu)化。
英偉達(dá)與中國公司的“!迸c“機(jī)”
在媒體溝通會上,英偉達(dá)GPU計算專家團(tuán)隊(duì)亞太區(qū)總監(jiān)李曦鵬,強(qiáng)調(diào)英偉達(dá)25年來持續(xù)在進(jìn)行“加速計算”。消費(fèi)級市場對英偉達(dá)一直是“顯卡廠商”定位,但從AI算力進(jìn)入主流產(chǎn)學(xué)界后,加速計算這一定位開始充分體現(xiàn)。
NVIDIA數(shù)據(jù)中心平臺/英偉達(dá)
除了顯卡產(chǎn)品與新技術(shù)外,英偉達(dá)在大會上用了更多筆墨展示其在數(shù)據(jù)中心以及產(chǎn)業(yè)端的支持,包括第三代的NVLink和NVSwitch等技術(shù)的展望,其中還包括對中小企業(yè)、創(chuàng)業(yè)公司乃至傳統(tǒng)公司的支持。
例如圍繞軟件支持,李曦鵬提到,借助CUDA統(tǒng)一架構(gòu),英偉達(dá)保證了新的應(yīng)用能持續(xù)滿足市場需求,做到了算法、軟件、硬件的相互配合,在本代Ampere架構(gòu)下,TensorFlow有了專門的配套,TensorRT也提供更好的矩陣乘法支撐,甚至還有加速SDK,同時英偉達(dá)也積極投身到應(yīng)用的開發(fā)上,滿足更多企業(yè)或機(jī)構(gòu)“開箱即用”,進(jìn)一步服務(wù)更多B端。
企業(yè)端的表現(xiàn)吸引了眾多中國公司參與,包括阿里巴巴、字節(jié)跳動、中國電信、浪潮、快手等,中國的OEM廠商、云廠商、互聯(lián)網(wǎng)企業(yè)都在利用英偉達(dá)相關(guān)產(chǎn)品與技術(shù)進(jìn)行開發(fā)。
英偉達(dá)醫(yī)療業(yè)務(wù)全球副總裁Kimberly Powell,在15日主論壇圓桌環(huán)節(jié)提到,中國平安、聯(lián)影智能、推想科技和數(shù)坤科技在新冠疫情期間,利用英偉達(dá)GPU產(chǎn)品與技術(shù),加快了影像診斷,為影像診斷提供巨大幫助。
英偉達(dá)亞太區(qū)戰(zhàn)略運(yùn)營與合作伙伴副總裁Ashok Pandey,在圓桌中直接用中文表示,英偉達(dá)與中國云服務(wù)廠商合作已7年,目前頂級的中國云服務(wù)商已經(jīng)推出或即將推出基于A100的新產(chǎn)品,更多AI應(yīng)用也將面向更多云服務(wù)開發(fā)者和使用者。
同時在超算中大放異彩的ARM也將在中國的云、數(shù)據(jù)中心、邊緣計算場景市場中出現(xiàn),英偉達(dá)宣稱,未來ARM的開放度不會受到貿(mào)易管制影響。
英偉達(dá)工程與解決方案高級總監(jiān)李浩南表示,GPU加速的ARM服務(wù)器正在各個場景中夯實(shí),目前在HPC、AI以及游戲中已有表現(xiàn),更多中國公司將加入到ARM陣營。
2013-2020英偉達(dá)投資布局版圖/億歐商業(yè)分析師趙寧
除了產(chǎn)品與技術(shù)市場的合作外,英偉達(dá)過去在全球范圍內(nèi)布局了眾多AI初創(chuàng)公司,本次大會上,12家中國初創(chuàng)公司得到了英偉達(dá)幫助。
在本次GTC大會上,100家初創(chuàng)公司通過“英偉達(dá)初創(chuàng)加速計劃”,在40家投資機(jī)構(gòu)及產(chǎn)業(yè)代表投票中,12家企業(yè)參與了線上展示,涉及領(lǐng)域包括醫(yī)療、零售、消費(fèi)互聯(lián)網(wǎng)、深度學(xué)習(xí)、IoT、工業(yè)制造等領(lǐng)域。
相比過去,英偉達(dá)對于中國市場的重視程度不斷加強(qiáng)。中國是全球AI算力最富集的地區(qū)之一,大量AI與數(shù)字化公司需要更多算力支持,同時中國也是自動駕駛成長最快的市場,以百度Apollo、地平線、馭勢科技、四維圖新等為代表,AI芯片必將是核心需要。
另一方面,目前中國市場占到英偉達(dá)收入一半左右,通過在ARM、Mellanox的布局,英偉達(dá)有了更強(qiáng)的數(shù)據(jù)中心建設(shè)能力,但同時也讓中國客戶不得不購買英偉達(dá)的產(chǎn)品。
超算采購已經(jīng)成為英偉達(dá)核心收入之一,通過外延并購,其完成了對超算產(chǎn)品的嚴(yán)密布局,中國公司進(jìn)入的門檻被大大提高。
換句話說,在服務(wù)器與底層技術(shù)上,中國公司與海外巨頭的競爭差距被資本拉大,知名的OEM廠商看似在生產(chǎn)高附加值的服務(wù)器,但仍處于利潤的微笑曲線底部。
面對英偉達(dá)的橄欖枝,中國公司與市場充滿了機(jī)遇與挑戰(zhàn),下游企業(yè)可以充分享受產(chǎn)品技術(shù)、乃至生態(tài)紅利;英偉達(dá)、AMD、英特爾等半導(dǎo)體巨頭仍占有巨大優(yōu)勢。
這對國產(chǎn)自研的刺激并不低,寒武紀(jì)為代表的中國上市公司會越來越多,從另一個角度而言,這也不失為另一種機(jī)會。
參考資料:
《WIA2020 | 2020全球半導(dǎo)體芯片科技創(chuàng)新TOP50》,億歐智庫,何少佳,2020年12月9日
《2020年中國人工智能商業(yè)落地研究報告》,億歐智庫,張一豪,2020年7月10日
作者:黃志磊

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?