想感受最新的科技,只需關(guān)注IT領(lǐng)域就夠了,因為這里的新技術(shù)迭代極快,幾乎每天都有創(chuàng)新。
而在IT領(lǐng)域,當(dāng)前最炙手可熱的就是人工智能,它正在引領(lǐng)著我們一步步走向“科幻電影”般的未來。
國際巨頭角逐巨量模型
就在本周,微軟和英偉達聯(lián)合發(fā)布了Megatron-Turing自然語言生成模型(MT-NLG)。其包含5300億個參數(shù),成為了英文領(lǐng)域最強的巨量模型。
而在兩周前,浪潮發(fā)布了人工智能巨量模型“源1.0”,它則是中文領(lǐng)域最強的巨量模型。
他們二者都代表了行業(yè)內(nèi)最先進的人工智能巨量模型,也讓我們看到國內(nèi)企業(yè)浪潮與微軟、英偉達等巨頭站在了同一起跑線上。就訓(xùn)練難度而言,中文模型源1.0顯然更具挑戰(zhàn)。
從OpenAI的GPT-3、到浪潮的源1.0,再到微軟和英偉達聯(lián)合發(fā)布Megatron-Turing,可以看到,眾多IT巨頭們都開始將戰(zhàn)略重點轉(zhuǎn)移到角逐人工智能巨量模型領(lǐng)域了。
現(xiàn)在的人工智能模型非常多,幾乎所有互聯(lián)網(wǎng)企業(yè)都在做,在搜索引擎上搜索“AI模型”,會有超過3270萬條相關(guān)結(jié)果,足見其火熱程度。
那么,為什么很多IT巨頭會花費大量精力研究巨量模型呢?
答案很簡單,還不是因為一般AI模型“不靠譜”!
AI應(yīng)用,依然挑戰(zhàn)滿滿
現(xiàn)在很多服務(wù)領(lǐng)域的客服系統(tǒng)都用“AI機器人”替代人工了,美其名曰智能化降低運營成本。但實際效果卻并沒有那么理想。
我們做個簡單的測試,在電子商務(wù)平臺上問客服一些簡單問題,“AI”會通過關(guān)鍵詞搜索形式來幫你“解答”。如果問題稍微復(fù)雜,那么AI就無法理解用戶的意思,出現(xiàn)的結(jié)果完全就是風(fēng)馬牛不相及,此時則還需人工來受理。這其實就是模型參數(shù)不足所造成的。
并且,當(dāng)前互聯(lián)網(wǎng)等企業(yè)也面臨著嚴(yán)重的模型碎片化問題,企業(yè)各自為政針對不同領(lǐng)域都訓(xùn)練出了很多小模型,但其真正實戰(zhàn)效果卻往往僅有最基礎(chǔ)的水平。
所以當(dāng)前亟需的是有一定通用性并且基于海量數(shù)據(jù)訓(xùn)練的巨量模型,只有這樣它才能足夠聰明。如果用讀書來比喻的話,小模型可能僅有小學(xué)生水平,而巨量模型則早已具備教授的知識量了。
源1.0,最強大的中文巨量模型
在巨量模型領(lǐng)域,我們看到很多都是來自國外的模型,以中文為核心的模型少之又少。正如尼采所說,“誰也不能為你建造一座你必須踏著它渡過生命之河的橋,除你自己之外沒有人能這么做。”
無論是學(xué)術(shù)界還是產(chǎn)業(yè)界,都需要擁有符合我們國人習(xí)慣的中文巨量模型,才能真正讓AI實現(xiàn)落地。
正如前文所述,浪潮人工智能研究院發(fā)布的全球最大規(guī)模人工智能中文巨量模型“源1.0”,再次刷新了多項記錄,其單體模型參數(shù)量達到了驚人的2457億。
這個量級大概是個什么概念呢?
當(dāng)前的“網(wǎng)紅”語言模型當(dāng)屬 GPT-3,其在發(fā)布之時極具里程碑意義,它的參數(shù)量是1750億個,擁有570GB的英文語料庫。而浪潮的源1.0單體模型參數(shù)量則比GPT-3還高40%,訓(xùn)練采用的中文數(shù)據(jù)集達到了5000GB,它總共閱讀了大約 2000 億詞,是全球最大的中文數(shù)據(jù)集,在AI領(lǐng)域也絕對屬于巨量型選手。
如果說微軟聯(lián)合英偉達5300億個參數(shù)的Megatron-Turing是業(yè)界最大的話,那么源1.0則是中文界巨量模型的魁首。
我們來舉個例子,假設(shè)人一個月能讀十本書,一年讀一百本書,讀50年,一生所讀不過5000本。一本書如果20萬字的話,加起來也只有10億字。源1.0共閱讀了大約2000億詞,假如人一年讀100本20萬字的書,則需要一萬年才能讀完這2000億詞。
沒錯,就是一萬年,注意這可不是“大話西游”喲!
據(jù)了解,源1.0大模型共4095PD(PetaFlop/s-day)的計算量,獲得高達2457億的參數(shù)量;相對于GPT-3消耗3640PD計算量得到1750億參數(shù),源1.0大模型計算效率大幅提升。
而這些計算量的支撐,則是海量的浪潮服務(wù)器。眾所周知,浪潮AI服務(wù)器市占率已位居全球第一,并累計獲得56個MLPerf全球AI基準(zhǔn)測試冠軍,在人工智能領(lǐng)域的專利方面貢獻量也位居中國前列。浪潮在AI推理、訓(xùn)練方面能力絕對處于世界領(lǐng)先級。
實戰(zhàn)測試,AI水平拿下多個第一
在自然語言理解方面,由于分詞方式不同、同一詞組不同歧義以及新詞匯等方面挑戰(zhàn),所以中文訓(xùn)練的難度更高。
例如分詞難點:中國科學(xué)技術(shù)大學(xué);中國科學(xué)技術(shù)大學(xué);中國科學(xué)技術(shù)大學(xué)。這三種不同的分詞形式,表達的意思有著天壤之別。這還僅僅是其中之一。
因此可以說訓(xùn)練中文NPL要比英文難很多,源1.0的訓(xùn)練難度要比同量級英文模型難度更高。
空談理論并不務(wù)實,只有真正跑起來測試才見真知。源1.0的水平到底如何呢?
其實,它已經(jīng)刷新了權(quán)威中文語言理解測評基準(zhǔn)CLUE的零樣本學(xué)習(xí)和小樣本學(xué)習(xí)2項榜單榜首。
zero-shot零樣本學(xué)習(xí)和Few-shot learning 小樣本學(xué)習(xí)在是最能衡量巨量模型智能程度的兩項測試,在zero-shot榜單中,源1.0以超越第二名18.3%的絕對優(yōu)勢遙遙領(lǐng)先,在文獻分類(CSLDCP)、TNEWS(新聞分類),商品分類(IFLYTEKF)、OCNLIF(原生中文自然語言推理)、成語完型填空(CHIDF)、名詞代詞關(guān)系(CLUEWSCF)6項任務(wù)中獲得冠軍,甚至在成語閱讀理解填空(CHIDF)項目中超越人類的水平,成為最強人工智能。
在Few-shot learning榜單中,文獻分類(CSLDCP)、商品分類(IFLYTEKF)、文獻摘要識別真假(CSLF)、名詞代詞關(guān)系(CLUEWSCF)4項任務(wù)中獲得冠軍。
AI進階:實現(xiàn)吟詩作賦
我們對人工智能的最大訴求是什么?
當(dāng)然是“以假亂真”了,更期望的是能夠代替人類完成一些具體工作。那么最好的衡量方式依然是圖靈測試,也就是通過多輪測試,然后用真人來進行評估,如果人工智能讓平均每個參與者做出超過30%的誤判,那么這臺機器就會被認為具備人類智能了。
在圖靈測試中,源1.0表現(xiàn)出了非凡的“智力”,受訪者平均誤判率為50.84%,在新聞生成這一領(lǐng)域,誤判率更是高達57.88%。有意思的是,將源1.0創(chuàng)作的對話、小說續(xù)寫、新聞、詩歌、對聯(lián),混雜在文學(xué)大師的作品中,超50.84%的人不能辨別文學(xué)大師的作品和“源1.0”的作品。
接下來我們看看源1.0的作品,對聯(lián)的上聯(lián)為:五湖四海皆春色,源1.0所對下聯(lián)為:三江八荒任我游。
數(shù)字對數(shù)字,湖對江,海對荒,皆對任,并且念起來朗朗上口,還真看不出是機器所作。
下面一首詩詞也是源1.0撰寫,戰(zhàn)鼓催征千嶂寒,陰陽交會九皋盤。飛軍萬里浮云外,鐵騎叢中明月邊。
感受一下,是不是很有古詩的韻味了。讓人不禁感嘆,這個水平的人工智能真的越來越強大了!
此外,在故事編寫及人物對話等方面,源1.0也表現(xiàn)出了驚人的能力。
也就是說,源1.0不僅博學(xué),而且還善用?梢哉f,既寫的了八股文,又能與00后們網(wǎng)聊。通過測試可以發(fā)現(xiàn),源1.0的優(yōu)勢能夠廣泛應(yīng)用于人機對話、自助服務(wù)、智能辦公以及文獻智能識別等等領(lǐng)域。
源1.0,打造行業(yè)AI催化劑
如此強大的巨量模型,會不會有很高的門檻,讓企業(yè)高攀不起呢?
據(jù)浪潮信息副總裁、浪潮信息AI&HPC產(chǎn)品線總經(jīng)理劉軍介紹,浪潮將會開放源1.0,讓學(xué)術(shù)界和產(chǎn)業(yè)界都能夠直接使用,極大降低了巨量模型研究和應(yīng)用的門檻。
學(xué)術(shù)與產(chǎn)業(yè)相結(jié)合,給業(yè)界呈現(xiàn)出了一個有擔(dān)當(dāng)、大格局的浪潮,它不僅在服務(wù)器、存儲等硬件領(lǐng)域引領(lǐng)行業(yè),而且還在大數(shù)據(jù)、AI等方面展開新探索,包括此次源1.0的推出。
源1.0對于行業(yè)都有哪些幫助呢?據(jù)劉軍介紹,很多產(chǎn)業(yè)都會在源1.0的幫助下產(chǎn)生巨變,例如運營商的智能運維、智能辦公場景報告的自動生成、手機互聯(lián)網(wǎng)用戶自動對話的智能助手等等,未來都能夠變得更加智能。
正如劉軍所說,AI正在飛速進步,浪潮希望有足夠的動力快速推動數(shù)據(jù)、算法和算力這三駕馬車,降低AI開發(fā)者和行業(yè)用戶的使用門檻,以更通用的人工智能巨量模型賦能科研創(chuàng)新、公共服務(wù)智慧化升級和產(chǎn)業(yè)AI化應(yīng)用,加速人工智能落地,進而構(gòu)建出一個智慧化的未來。