強人工智能的第一步?巨頭混戰(zhàn)ChatGPT
前言:
ChatGPT一次運算的成本高達450萬美元,OpenAI公司凈虧損高達5.45億美元,如若不是背后大股東微軟源源不斷的輸血支撐,OpenAI的ChatGPT早黃了。
作者 | 方文三
圖片來源 | 網(wǎng) 絡
新春佳節(jié)后,巨頭們宣布類ChatGPT進展
2月,微軟宣布推出由ChatGPT支持的最新版本人工智能搜索引擎必應和Edge瀏覽器。
微軟股價大漲4.2%,市值飆升800億美元。
幾乎同時,谷歌也將整合新的人工智能到搜索引擎中。
宣布人工智能對話式機器人Bard正在內(nèi)測,并在未來幾周內(nèi)向大眾提供服務。
百度將于3月在中國推出類似ChatGPT的人工智能聊天機器人[文心一言]。
百度港股漲幅快速擴大,截至收盤大漲15.33%。
騰訊、阿里、華為也紛紛宣布正在申請人工智能人機對話專利。
360也于近期在互動平臺上表示,計劃盡快推出類ChatGPT技術的demo版產(chǎn)品。
ChatGPT的出現(xiàn)提升了自然語言處理能力的上限,打開了人工智能技術商業(yè)化落地且成為消費端爆款的大門,因此具有劃時代的意義。
差異化戰(zhàn)略,股價兩重天
2022年12月底,谷歌深感來自ChatGPT的壓力,迅速抽調(diào)員工開展ChatGPT競品產(chǎn)品的研究。
谷歌已向AI初創(chuàng)公司Anthropic投資了近4億美元,Anthropic正在進行ChatGPT競爭產(chǎn)品的測試,這家公司成立于2021年,創(chuàng)始團隊正是來自于ChatGPT的開發(fā)商OpenAI。
谷歌宣布將推出名為Bard的AI聊天機器人,這款產(chǎn)品是基于對話應用語言模型(LaMDA)的實驗性AI程序,目前已經(jīng)開展測試,并在幾周內(nèi)向公眾開放。
微軟更是迅速響應,加快了相關應用的研發(fā)。
近日,微軟宣布將ChatGPT整合至全線產(chǎn)品中,并擴大與ChatGPT所有者OpenAI的深度合作。
推出由ChatGPT支持的,融入GPT-3.5語言技術的最新版本人工智能搜索引擎Bing(必應)和Edge瀏覽器。
微軟推出了集成ChatGPT技術的新版搜索引擎New Bing和瀏覽器Edge,這也成為微軟在搜索引擎領域?qū)构雀璧闹匾淦鳌?/p>
像谷歌和Meta這樣的大公司肯定會有一定優(yōu)勢,因為他們擁有人力、技術和財力資源。
因此,這些公司在市場上有足夠的空間,這將是一場新的比賽,尤其是在深度和正確性方面。
相較之下,微軟和亞馬遜選擇的應對策略是與OpenAI結盟,試圖借其東風。
Bard作為對抗ChatGPT而推出的關鍵對標產(chǎn)品,可謂是備受關注。
按照谷歌的宣傳,Bard是一項實驗性對話式AI服務,由LaMDA提供支持,并運用到了谷歌的大型語言模型和網(wǎng)絡信息構建。
可萬萬沒想到,趕了個晚集的谷歌卻在自己的發(fā)布會上翻車了。
發(fā)布會中展現(xiàn)的錯誤答案后,谷歌股價大跌7.68%,一夜之間市值縮水約7202億元,是截止到目前AI犯過的最貴的錯誤。
出圈背后有AIGC的功勞
AIGC的核心變革,發(fā)生在內(nèi)容層,位于數(shù)據(jù)層之上。
AIGC在繪畫和會話等方面突破的重要性,在人工智能領域相當于2016年,阿爾法狗戰(zhàn)勝人類圍棋冠軍的價值。
ChatGPT最大的意義是讓人們看到了一個更加智能高效時代的輪廓。
ChatGP本身也是AI技術迭代到一定階段后的產(chǎn)物。
服務器+網(wǎng)絡開啟了人人上網(wǎng)的時代,而算力+算法將開啟人人上算的時代。
AI將以場景、應用、內(nèi)容來創(chuàng)造用戶的新需求。
AIGC技術主要涉及兩個方面,自然語言處理(NLP)和AIGC生成算法,AIGC投資方向主要包括軟硬件與數(shù)據(jù)集。
以ChatGPT為代表的大型語言模型(LLM)將會成為未來巨頭爭奪的重點。
ChatGPT展示了巨大的應用潛力,完全不局限于創(chuàng)作文本或者圖像。
距離AIGC真正落地以及實際應用還有很遠的路。
目前ChatGPT更像一個[玩具],還不是生產(chǎn)力工具。
西部證券則預測,AIGC或在2023年迎來發(fā)展大年,來到兩年前自動駕駛的應用突破拐點。
實現(xiàn)ChatGPT的最大亮點也是最大難點
ChatGPT需要把大模型盡量變成小模型或者稀疏模型,且大模型的訓練和使用成本都很高。
除了模型之外的另一個難點在于如何實現(xiàn)ChatGPT后半段的人工過程變成自動訓練。
ChatGPT是在大模型的基礎上,加入了很多人類反饋。這需要大量的人工,而這部分工作目前是至關重要的。
截至目前,OpenAI已經(jīng)總計獲得超過110億美元的融資,微軟、谷歌風投、馬斯克等均曾出手投資,而且其目前并未盈利。
如此巨額的投入恐怕今天的互聯(lián)網(wǎng)巨頭也只能望而卻步。
但從另一個角度來說,這也給了創(chuàng)業(yè)型團隊機會。通過不斷深入挖掘某項技術,瞄準特定的細分賽道能夠切到一塊蛋糕。
高算力帶火芯片行業(yè)
ChatGPT的注冊用戶便已經(jīng)過億,海量的用戶訪問曾多次導致ChatGPT官網(wǎng)因為訪問數(shù)太多而宕機。
這意味著,OpenAI要想保證用戶體驗,它就必須得加大算力的投入。
而這就需要大量芯片的支持了,這無疑直接給本已快陷入沉寂的芯片市場注入了一劑猛藥。
ChatGPT的總算力消耗約為3640PF-days,ChatGPT已導入了至少1萬顆英偉達高端GPU。
而花旗集團預估,ChatGPT將可能促使英偉達相關產(chǎn)品在12個月內(nèi)銷售額達到30億至110億美元。
ChatGPT的大火將促使算力需求大大增加,350瓦推理芯片會成為常態(tài),技術上會推動大模型壓縮到達一個新高潮,同時企業(yè)和個人的服務有許多可以基于類似技術構建。
高性能計算芯片是一切AI的底層基礎,目前AI芯片主要有通用GPU算力芯片和ASIC專用芯片兩大類型。
或許在ChatGPT的幫助下,芯片行業(yè)將迎來新一輪的市場紅利期。
ChatGPT帶來AI技術范式革新
相比其他大模型,ChatGPT在AI的技術路線和訓練方式上的變革,帶來了業(yè)界意料之外的突破。
①ChatGPT有一個非常強大的技術底座,也就是InstructGPT模型。
此前,GPT與BERT模型路線一直在競爭,2018年時BERT模型先贏了,但GPT模型參數(shù)和數(shù)據(jù)規(guī)模越做越大。
最終結合人工反饋增強學習(RLHF),在ChatGPT上取得了重大突破,效果上反超了BERT模型路線。
②ChatGPT引入了強化學習機制,在新版本上引入了人工標注的數(shù)據(jù),通過人類的反饋,有針對性地進行優(yōu)化。
其中的難度在于,建立怎樣的強化學習機制。過去業(yè)界也嘗試了強化學習機制,但很多都不太成功,ChatGPT在這件事上取得了突破。
③ChatGPT在數(shù)據(jù)質(zhì)量和多樣性上非常講究。
ChatGPT強化學習的數(shù)據(jù)量并不大,但對數(shù)據(jù)多樣性、標注體系都有精巧的設計,讓數(shù)據(jù)發(fā)揮出了強大的作用。
成本導致國內(nèi)與國外路線不同
ChatGPT的重點在于創(chuàng)造,通過大量的語料訓練和強大的糾錯能力,對素材進行消化、整理和再輸出,這和過去國內(nèi)關注的云計算或視覺技術是完全不同的思考方式。
而導致上述分別的原因也很直接,那就是成本。
ChatGPT背后有著海量的資料庫和龐大的算力做支撐,變現(xiàn)方式目前來看卻只有向企業(yè)提供服務,替代部分人工作業(yè)這一種。
對于產(chǎn)品化而言,即使再將成本下降10倍,這個商業(yè)模式也是無法成立的,因為這個成本與人類相比沒有優(yōu)勢。
背后的支撐是人工智能大模型
當前的人工智能大多是針對特定的場景應用進行訓練,生成的模型難以遷移到其他應用, 屬于[小模型]的范疇。
整個過程不僅需要大量的手工調(diào)參,還需要給機器喂養(yǎng)海量的標注數(shù)據(jù),這拉低了人工智能的研發(fā)效率,且成本較高。
[大模型]通常是在無標注的大數(shù)據(jù)集上,采用自監(jiān)督學習的方法進行訓練。
在其他場景的應用中,開發(fā)者只需要對模型進行微調(diào),就可以滿足新應用場景的需要。
這意味著,對大模型的改進可以讓所有的下游小模型受益,大幅提升人工智能的適用場景和研發(fā)效率。
因此大模型成為業(yè)界重點投入的方向,Open AI、谷歌、臉書、微軟, 國內(nèi)的百度、阿里、騰訊、華為和智源研究院等紛紛推出超大模型。
特別是OpenAI GPT 3大模型在翻譯、問答、內(nèi)容生成等領域的不俗表現(xiàn),讓業(yè)界看到了達成通用人工智能的希望。
當前ChatGPT的版本為GPT 3.5,是在GPT3之上的調(diào)優(yōu),能力進一步增強。
業(yè)界普遍預測,GPT4將在今年推出,并具備更強大的通用能力。
ChatGPT的產(chǎn)業(yè)未來與投資機會
①ChatGPT模型的出現(xiàn)對于文字/語音模態(tài)的 AIGC 應用具有重要意義,會對AI產(chǎn)業(yè)上下游產(chǎn)生重大影響。
從下游相關受益應用來看,包括但不限于無代碼編程、小說生成、對話類搜索引擎、語音陪伴、語音工作助手、對話虛擬人、人工智能客服、機器翻譯、芯片設計等。
從上游增加需求來看,包括算力芯片、數(shù)據(jù)標注、自然語言處理(NLP)等。
②隨著算法技術和算力技術的不斷進步,ChatGPT也會進一步走向更先進功能更強的版本,在越來越多的領域進行應用,為人類生成更多更美好的對話和內(nèi)容。
核心技術之一是Transformer
Transformer技術是近幾年人工智能技術最大的亮點之一。
谷歌于2017年提出的一種采用注意力機制的深度學習模型,可以按輸入數(shù)據(jù)各部分重要性的不同,而分配不同的權重。
Transformer的精度和性能上都要優(yōu)于之前流行的CNN(卷積神經(jīng)網(wǎng)絡)、RNN(循環(huán)神經(jīng)網(wǎng)絡)等模型。
大幅提升了模型訓練的效果,讓人工智能得以在更大模型、更多數(shù)據(jù)、更強算力的基礎上進一步增強能力。
目前人工智能已經(jīng)找到解決方案的問題,也只是可計算問題的一小部分。
如果說傳統(tǒng)的機器學習或人工智能是在水下一米的深處探索,那么深度學習的出現(xiàn)將人們帶到了一百米的深水區(qū);
而在Transformer、GPT等架構后,從業(yè)者們直接能抵達深度超過萬米的馬里亞納海溝。
過去5年中,大規(guī)模預訓練語言模型受到業(yè)內(nèi)越來越多的重視。
今天,全世界的人工智能研究有很多方向,也產(chǎn)生了大量的成果。
但是嚴格來說,所有這些最令人驚艷的結果, 90%以上是基于Transformer迭代來的這些大模型技術得到的。
目前幾乎所有的AI任務和項目,都會和大語言模型技術有關聯(lián),它已經(jīng)代表了AI界最主流的科研和技術迭代方向。
未來,ChatGPT與更多的AI、云計算等信息技術的集成創(chuàng)新,將創(chuàng)造改變生產(chǎn)力曲線的工具,成為經(jīng)濟發(fā)展新動力。
結尾:
ChatGPT勾起人們對步入強人工智能時代的聯(lián)想,即人工智能具有自己的意向性來設定目標。
雖然強人工智能本身還存在諸多爭論,但是分析人士普遍認可,人工智能的發(fā)展大年與信息時代新階段將至。
原文標題 : AI芯天下丨深度丨強人工智能的第一步?巨頭混戰(zhàn)ChatGPT

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?