訂閱
糾錯
加入自媒體

AI大模型在退燒,但巨頭已經(jīng)卷瘋了

    Chaos新觀察  No.17  

大模型不是萬能解藥。

文 | 曹乙

報道 | Chaos新觀察

ID | GoChaos

封面來源 | Unsplash

“不管什么賽道,只要大廠一做,你就知道要開始卷了”——這句行業(yè)內(nèi)的戲言如今正在大模型身上應(yīng)驗。

自今年3月ChatGPT爆火之后,國內(nèi)起了一股“備戰(zhàn)”大模型之風,各大廠紛紛重金押注:all in AI多年的百度推出“文心一言”誓與ChatGPT一戰(zhàn),華為“盤古”席卷行業(yè),阿里“通義千問”落地辦公領(lǐng)域……大模型的火熱程度,似乎為唱衰許久“大廠流量見頂”的陰霾照進了一絲光明。

與此同時,全球大模型獨角獸企業(yè)“瘋狂吸金”,短短半年內(nèi),由前OpenAI領(lǐng)導人創(chuàng)立的人工智能企業(yè)Anthropic就連獲三輪大額融資,總額超8.5億美元。這進一步刺激了國內(nèi)大模型創(chuàng)業(yè),截至今年5月,中國公開發(fā)布的AI大模型數(shù)量就已近百個,單獨統(tǒng)計帶有 AIGC 標簽的公司,2023 年上半年融資交易 58.9 億元,事件數(shù)量 42 起,均遠超往年

但進入下半年,行業(yè)開始逐漸降溫。盈利點不清晰,許多創(chuàng)業(yè)項目還停留在概念驗證階段,初創(chuàng)企業(yè)融資越來越難:一部分投資人舉棋不定,一部分投資人干脆放棄看大模型項目,轉(zhuǎn)向芯片。

馬太效應(yīng)正在加劇,創(chuàng)業(yè)公司突圍艱難。對于初創(chuàng)企業(yè)來說,“落地”成了重中之中。誰能推出重磅應(yīng)用,或能率先殺出重圍

大廠的“必爭之地”

大模型到底是一種什么技術(shù)?

大模型,即大語言模型,是指使用大量文本數(shù)據(jù)訓練的深度學習模型,可以生成自然語言文本或理解語言文本的含義。簡單來說,大模型能夠模擬人類學習語言的過程,以類似人類的方式理解和生成文本,是通向人工智能的重要途徑。

在ChatGPT爆火之前,人們對于AI的現(xiàn)實印象還停留在Siri和天貓精靈,那時人們戲稱其為“人工智障”,意在吐槽這一時期的AI“不夠智能”。誰也沒有想到短短幾年時間,AI就從“聽懂指令”進化到“執(zhí)行指令”,甚至能夠基于指令自我學習,創(chuàng)作文案、腳本、繪圖。

2016年,AlphaGo戰(zhàn)勝世界圍棋冠軍李世石,曾引發(fā)人們對AI發(fā)展的短暫恐慌。但很快,消費互聯(lián)網(wǎng)的爆發(fā)占據(jù)了人們的注意力,AlphaGo等機器人被認為只能用于像下棋這樣的益智游戲;7年后,在經(jīng)歷了消費降級、人口紅利消失等危機后,ChatGPT的橫空出世,讓人們嗅到了一絲來自未來的挑戰(zhàn)。有的大廠積極調(diào)轉(zhuǎn)車頭押注AI,有的大廠則是默默耕耘,一朝聞名

打響第一槍的是百度“文心一言”——這是百度在2021年12月推出的百度·文心(ERNIE 3.0 Titan)迭代而來的細分模型,百度創(chuàng)始人李彥宏稱將用其重構(gòu)百度所有的應(yīng)用。6年前,百度開啟“all in AI”戰(zhàn)略轉(zhuǎn)型人工智能,現(xiàn)在看來是一個十分具有前瞻性的戰(zhàn)略。

百度文心一言發(fā)布會

作為國內(nèi)首屈一指的搜索應(yīng)用,百度擁有龐大而豐富的中文語料庫,天然具有研發(fā)AI大模型所需要的深度學習基因:2019年百度與國外同期搭建了學習型的文心大模型,而后2022年上線了基于文心大模型的AI繪圖文心一格,2023年3月推出生成式AI產(chǎn)品文心一言......這也難怪產(chǎn)品一經(jīng)發(fā)布,就被網(wǎng)友們用于和ChatGPT比較。

隨后,4月11日,阿里云推出通義千問大語言模型,迎戰(zhàn)文心一言。阿里董事會主席兼CEO張勇宣布,阿里所有產(chǎn)品將接入大模型全面升級。

阿里云的強大算力和巨量數(shù)據(jù)正是研發(fā)大模型優(yōu)勢所在,而通義千問也不負眾望地實現(xiàn)了眾多功能:多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持等功能,融入了多模態(tài)的知識理解,能夠續(xù)寫小說,編寫郵件等。日前通義千問已嘗試向辦公領(lǐng)域落地,接入辦公軟件釘釘,開始幫打工人“搬磚”——做ppt、表格、設(shè)計海報、撰寫文案。

緊接著,4月24日,科大訊飛星火認知大模型官網(wǎng)正式上線。作為AI語音龍頭,訊飛星火認知大模型圍繞“知識問答、代碼編程、數(shù)理推算、創(chuàng)意聯(lián)想、語言翻譯”等場景布局,并嘗試與教育垂直場景的深度融合

同樣在探索垂直場景的,還有京東在7月13日發(fā)布的靈犀大模型:與京東賦能產(chǎn)業(yè)的核心戰(zhàn)略相同,靈犀大模型融合了70%通用數(shù)據(jù)與30%數(shù)智供應(yīng)鏈原生數(shù)據(jù),深入零售、物流、金融、健康、政務(wù)等知識密集型、任務(wù)型產(chǎn)業(yè)場景,解決真實產(chǎn)業(yè)問題。

與以上幾家正在探索落地的大廠不同,華為的盤古大模型似乎已經(jīng)找到了“落點”:7月18日,華為聯(lián)合山東能源集團舉行發(fā)布會,宣布華為盤古大模型在礦山領(lǐng)域?qū)崿F(xiàn)首次商用,為大模型的落地應(yīng)用提供了良好的范本。實際上,盤古大模型就啟動研發(fā),華為云CEO張平安表示,希望用盤古大模型幫助各行各業(yè),例如金融、政務(wù)、礦山、氣象等行業(yè),利用盤古大模型在產(chǎn)品研發(fā)、生產(chǎn)供應(yīng)鏈、市場營銷以及數(shù)字運作領(lǐng)域為其賦能——這與華為的B端策略一脈相承。

在這場“百模大戰(zhàn)”中,字節(jié)和騰訊兩家巨頭卻顯得尤為低調(diào)。字節(jié)系的火山引擎6月28日發(fā)布大模型服務(wù)平臺“火山方舟”,面向企業(yè)提供模型精調(diào)、評測、推理等全方位的平臺服務(wù),集成多個大模型,供客戶直接對比——大搭戲臺,聚眾所長,正是字節(jié)風格;而騰訊的混元大模型,于8月3號宣布進入內(nèi)測階段,主要應(yīng)用于騰訊廣告、3D虛擬場景自動生成、對話式智能助手等。

從消費互聯(lián)網(wǎng)時代脫穎而出的美團則選擇“燒錢”模式——前有狂砸20.65億元收購大模型創(chuàng)業(yè)公司光年之外,后又花費數(shù)億投資智譜AI,比起自研大模型耗費的大量人力、物力、算力和高要求的技術(shù)基礎(chǔ),和創(chuàng)業(yè)公司合作,既可以節(jié)省時間和精力,又避免與巨頭正面競爭。

不難發(fā)現(xiàn),大模型的研發(fā)具有共性:即,背后需要“巨量數(shù)據(jù)、巨量算法、巨量算力”支撐,同時還需要“巨量”人力、時間、財力的投入——這與消費互聯(lián)網(wǎng)時代“服務(wù)器+程序員隊伍+產(chǎn)品經(jīng)理”搭起一個應(yīng)用不同,打造一個大模型對任何企業(yè)而言都不是一件容易的事情?梢灶A見,未來大模型基本會成為大平臺和科技公司的專屬領(lǐng)地。

那么,耗費了巨額成本的大模型,能夠肩負起大廠“第二增長曲線”重任嗎?

大模型有了,應(yīng)用在哪里?

接下來要回答第二個問題,大模型究竟有什么用?

炙手可熱的同時,大模型也備受質(zhì)疑:今年3月,超過千名產(chǎn)業(yè)界和學術(shù)界的大佬們發(fā)布聯(lián)名公告:呼吁全球所有實驗室暫停比更強的AI模型研發(fā),暫停時間至少為6個月。在此期間,人工智能領(lǐng)域的專家和行業(yè)參與者應(yīng)該共同制定一套安全協(xié)議,并對技術(shù)發(fā)展進行嚴格的審查和監(jiān)督。其中就包括了特斯拉 CEO 埃隆·馬斯克、以及蘋果聯(lián)合創(chuàng)始人Steve Wozniak。

而人們在嘗試過ChatGPT之后也發(fā)現(xiàn),它所創(chuàng)作或呈現(xiàn)出來的答案并不理想,尤其是對中文語言的識別差強人意。6月份,ChatGPT網(wǎng)站在全球的桌面和移動端流量比5月減少9.7%,獨立訪客減少5.7%。

與此同時,使用AI所產(chǎn)生的倫理問題也被警惕起來。日前,黑莓公司(BlackBerry)發(fā)布了一項最新研究稱,目前全球有75%的組織,正考慮禁止在工作場所使用ChatGPT和其他生成式 AI 應(yīng)用;61%正在部署或考慮ChatGPT禁令的公司表示,禁用ChatGPT的措施將是長期或永久性的。其中被談?wù)摰米疃嗟囊琅f是AI數(shù)據(jù)泄漏和隱私安全問題。

在國內(nèi),利用生成式AI詐騙的案例也層出不窮。曾有新聞爆出有受害者被AI詐騙430萬,AI換臉、AI擬聲的引起的侵權(quán)問題更是如雨后春筍。前段時間朋友圈刷屏的“妙鴨相機”也因為隱私霸王條款和不支持退款的問題被上海市消協(xié)點名批評。

回到一開始的問題,大模型究竟有什么用?

如果說C端使用者對AI的需求仍停留在消費互聯(lián)網(wǎng)時代的社交、對話、聊天,那么B端才是大模型落地、“變現(xiàn)”的關(guān)鍵支點。畢竟,“百模大戰(zhàn)”耗費的巨大成本無法支撐C端“注意力經(jīng)濟”的玩法,只有走入垂直產(chǎn)業(yè)應(yīng)用,才能真正讓AI服務(wù)人類。

目前國內(nèi)行業(yè)大模型發(fā)展模式主要有兩種,一種是“自有通用大模型+外部行業(yè)數(shù)據(jù)”,另一種是“自有或其他開源大模型+自有行業(yè)數(shù)據(jù)”。

“自有通用大模型+外部行業(yè)數(shù)據(jù)”主要是自有通用大模型的企業(yè)以“1+N”模式拓展多個行業(yè)大模型,比如百度基于“文心”拓展了金融、醫(yī)療、傳媒等行業(yè)大模型,又如華為基于盤古大模型拓展了礦山領(lǐng)域。這種模式的優(yōu)勢在于,可以利用通用大模型的強大語言能力,快速適應(yīng)不同行業(yè)的需求,同時也可以借助外部數(shù)據(jù)源,增強行業(yè)相關(guān)性和準確性。

“自有或其他開源大模型+自有行業(yè)數(shù)據(jù)”一般是由行業(yè)公司結(jié)合自身領(lǐng)域數(shù)據(jù)訓練,比如一站式AI視頻技術(shù)服務(wù)商百家云,基于自身視頻SaaS/PaaS業(yè)務(wù)和產(chǎn)品數(shù)據(jù),推出業(yè)內(nèi)首款適用于企業(yè)市場部內(nèi)容生產(chǎn)場景的GPT大模型引擎“市場易”,通過文案生成、內(nèi)容發(fā)布、傳播分析、輿情監(jiān)測、知識庫、體驗中心六大功能板塊,重構(gòu)企業(yè)市場營銷及推廣工作機制。這種模式的優(yōu)勢在于充分利用自有數(shù)據(jù)的質(zhì)量和數(shù)量級,打造出更專業(yè)、更精準的行業(yè)大模型,同時也可以借鑒其他開源大模型的技術(shù)和經(jīng)驗,提升訓練效率和效果。

業(yè)內(nèi)人士分析,相對而言,垂類大模型在細分領(lǐng)域在解決數(shù)據(jù)安全隱患、缺乏行業(yè)深度等問題方面更具優(yōu)勢。以AI制藥行業(yè)對大模型的需求為例,由于藥物研發(fā)對高精度實驗數(shù)據(jù)的獲取成本較高,且公開數(shù)據(jù)庫中有大量無標注數(shù)據(jù),因此大模型在模型建構(gòu)上的要求會更高。既要利用好大量無標注數(shù)據(jù),又要利用好少量高精度數(shù)據(jù),這樣的需要對于通用大模型而言無疑是一種“災難”。

通用大模型研發(fā)所需要的高額成本令不少企業(yè)“望洋興嘆”,而垂類大模型則有機會填補這一空白:當前需要探索的不僅僅是讓大模型如何“海納百川”、如何“更加聰明”,更應(yīng)該考量如何降低垂類大模型在訓練時間、調(diào)試成本、部署成本方面的成本,讓大模型賦能百行千業(yè)、走進千家萬戶。

關(guān)于通用還是行業(yè)大模型路徑更好,有業(yè)內(nèi)人士指出,當下被鼓吹的行業(yè)大模型始終存在著被替代的風險。有業(yè)內(nèi)人士表示,10年前,在語音識別技術(shù)上,也曾誕生過諸多聚焦在通話、行車、辦公等不同場景的專用模型,但隨著通用模型技術(shù)的成熟,專用模型也隨之退場。從更長遠角度看,通用大模型才真正代表著一個平臺級或顛覆性的大機會。

在場景落地方面,據(jù)不完全統(tǒng)計,至2023年5月,Bloomberg資訊中共有58個AI應(yīng)用落地案例,主要集中在傳媒、游戲、機器人、辦公、醫(yī)藥等領(lǐng)域。例如Discord、Snap、BuzzFeed等廠商通過OpenAI開發(fā)自身AI產(chǎn)品,Meta公司5月發(fā)布的AI Sandbox大模型,可以為廣告生成不同的文字,以迎合不同消費者的需求,目前國內(nèi)企業(yè)也推出了應(yīng)用。

說到底,各企業(yè)的大模型產(chǎn)品各有側(cè)重、內(nèi)核相似,但各家的競爭力如何?這取決于客戶

創(chuàng)業(yè)公司能追上大廠嗎?

用戶在選擇大模型產(chǎn)品時,會重點考察哪些方面?

主要從云、基礎(chǔ)設(shè)施、服務(wù)等角度來看。

大模型離不開云廠商。國內(nèi)迭代最快的大模型公司,如百度、阿里都有自己的云業(yè)務(wù)。

大模型創(chuàng)業(yè)的生態(tài)分為四層——芯片層、框架層、模型層、應(yīng)用層。其中芯片層+框架層是基礎(chǔ)設(shè)施,企業(yè)的進入門檻最高;模型層對算力、算法、數(shù)據(jù)、人才的要求非常高;應(yīng)用層是基于前兩類大模型,調(diào)用API開發(fā)應(yīng)用。所有的玩家都要在這四大層級里站位,縱向覆蓋的層級越多,競爭壁壘越深厚。

企業(yè)客戶在選擇大模型時,不能只看中技術(shù)實力,是否懂行,能否保證交付,運維有沒有長期保障,同等重要。

大模型框架圖

創(chuàng)業(yè)公司與大廠的競爭主要來自數(shù)據(jù)、算法、算力幾個維度。

有業(yè)內(nèi)人士認為,OpenAI并沒有在“科學”層面領(lǐng)先大家太多。模型效果更好的原因恐怕還是來源于“工藝”,追隨者能夠趕上的希望很大,畢竟數(shù)字世界的迭代速度遠超現(xiàn)實物理世界。

關(guān)鍵競爭點是數(shù)據(jù)質(zhì)量和工程化能力,算法則可以逐步追平,創(chuàng)業(yè)公司或可以靠這些核心能力與大廠一戰(zhàn)。

8月3日,阿里大模型通義千問Qwen-7B日前宣布正式開源,阿里云成為中國首個宣布大模型開源的大型互聯(lián)網(wǎng)科技公司。

對于正在探索大模型的中小企業(yè)和初創(chuàng)企業(yè)來說,Qwen-7B的出現(xiàn)無疑降低了他們的技術(shù)和應(yīng)用門檻——開源大模型可以簡化模型訓練和部署的過程,讓用戶不必從頭訓練模型,只需下載預訓練好的模型并進行微調(diào),就能快速構(gòu)建高質(zhì)量的模型。初創(chuàng)公司有望通過深耕細分領(lǐng)域拿到關(guān)鍵分。

但圍繞算力的搶奪、成本的持續(xù)增高,會成為各家企業(yè)的共同痛點。

國內(nèi)云計算相關(guān)專家認為,做好AI大模型的算力最低門檻是1萬枚英偉達A100芯片。TrendForce研究則顯示,以A100的算力為基礎(chǔ),GPT-3.5大模型需要高達2萬枚GPU,未來商業(yè)化后可能需要超過3萬枚。

A100愈發(fā)搶手,市面的價格開始水漲船高,從官方的1萬美元一枚,約合人民幣7萬,漲到8、9萬,甚至10萬一枚。代理商透露,英偉達A100芯片價格從去年12月開始上漲,5個月累計漲幅達到37.5%。

有媒體報道,國內(nèi)云廠商主要采用的是英偉達的中低端性能產(chǎn)品,擁有超過1萬枚GPU的企業(yè)不超過5家,其中,擁有1萬枚英偉達A100芯片的最多只有一家。

OpenAl則指出,AI大模型要持續(xù)取得突破,所需要消耗的計算資源每3一4個月就要翻一倍。業(yè)內(nèi)指出,OpenAI每一次的訓練成本高達6000萬美元,每隔三四個月就需要訓練一次,迭代一次則需要四五次訓練。以此計算,每迭代一次技術(shù)基座可能需要2億到3億美元。

作為大模型的主要入局者,國內(nèi)互聯(lián)網(wǎng)大廠擁有天然的數(shù)據(jù)優(yōu)勢,在算力資源上早有布局,業(yè)內(nèi)人士表示,自2022年9月,美國禁止向國內(nèi)客戶售賣英偉達A100、H100和AMD的MI250人工智能芯片后,國內(nèi)大廠就開始大舉囤芯片。

在高額消耗面前,大廠的資金資源優(yōu)勢凸顯,對于初創(chuàng)企業(yè)來說,只有推出“殺手锏”應(yīng)用才能在這輪AI競賽中獲得下一輪的入場券。對于大廠來說,早切入應(yīng)用場景,也能早回血。

百家云發(fā)布的適用于企業(yè)市場部內(nèi)容生產(chǎn)場景的大模型引擎「市場易」,就瞄準了企業(yè)市場宣傳和輿情監(jiān)測需求,做到“易寫、易管、易看、易聽”,并能精準捕捉競品來自各種渠道的輿情信息和競品營銷方向信息,并對內(nèi)容的傳播進行量化評估,為企業(yè)制定戰(zhàn)略提供有力支持。8月底,百家云宣布,基于公司多年服務(wù)線上化場景的經(jīng)驗,將在現(xiàn)有技術(shù)積淀上,進一步幫助企業(yè)客戶構(gòu)建場景化AIGC應(yīng)用,打造面向大模型垂直應(yīng)用場景的一站式AIGC 場景化賦能中臺“百問大模型”。據(jù)介紹,百問支持私有化部署,可在企業(yè)內(nèi)部完整、獨立使用,服務(wù)更穩(wěn)定。

業(yè)內(nèi)人士表示,目前市場中的大模型產(chǎn)品大多是圍繞大語言模型。但是未來,大模型一定會走向多模態(tài),形成具備圖像、視頻、語音、語義綜合感知能力的智能體。例如,AI大模型能接入機器人,提升機器人的語言能力、視覺能力、運動控制能力,還有虛擬仿真能力。

Meta公司在今年7月發(fā)布了開源可商用大模型LLaMA2,包含了70億、130億和700億參數(shù)3個版本。人們越來越發(fā)現(xiàn),比之大模型本身,它背后日漸發(fā)展并快速迭代的生態(tài)更有價值。隨著大模型開源,未來,會有更多行業(yè)、更多企業(yè)加入這場浪潮,金融、醫(yī)療、傳媒、互聯(lián)網(wǎng)等知識密集型行業(yè)的一些固有工作模式或?qū)⒈桓淖,屆時,互聯(lián)網(wǎng)世界將迎來一次大變革。

與這些積極的聲音不同的是,一些學者認為,大型語言模型善于從數(shù)據(jù)中識別和提取因果關(guān)系,但缺乏自己主動推理新的因果場景的能力。它們具備通過觀察進行因果歸納的能力,但不具備因果演繹的能力。

AI 可能無法真正“學習”,而只能提煉信息或經(jīng)驗。AI 不是形成一個全面的世界模型,而是創(chuàng)建了一個概要。從這一點看,大模型可能并不是最終解。

如果我們想讓AI能夠真正通向“智能”,而不是作為一個“信息集成器”,并且像AlphaGo那樣曇花一現(xiàn)的話,那么在積極探索商業(yè)落地場景的同時,不妨也想一想,我們真正需要AI做什么。

*參考資料:

1.《大廠的大模型之戰(zhàn):八仙過海,各顯神通》,獨角獸挖掘機

2.《ChatGPT,將遭全球 75%的企業(yè)“封殺”?》,CSDN

3.《國產(chǎn)大模型已無公司可投》,量子位

4.《國內(nèi)外大模型產(chǎn)業(yè)如何發(fā)展?》,通信世界

5.《通用大模型創(chuàng)業(yè)潮,首戰(zhàn)即將終結(jié)》,36氪

*免責聲明:

1、本文內(nèi)容為Chaos新觀察原創(chuàng),內(nèi)容及觀點僅供參考,不構(gòu)成任何投資建議;文中所引用信息均來自市場公開資料,我司對所引信息的準確性和完整性不作任何保證。

2、本文未經(jīng)許可,不得翻版、復制、刊登、發(fā)表或引用。如需轉(zhuǎn)載,請聯(lián)系我們。

       原文標題 : AI大模型在退燒,但巨頭已經(jīng)卷瘋了

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號