訂閱
糾錯
加入自媒體

2024年中國大模型發(fā)展指數(shù)報告(總第3期)

(點擊文末閱讀原文,可查看PDF報告)

摘  要

本報告基于“研究、實踐、支撐”三維評估框架,系統(tǒng)解析中國大模型領(lǐng)域動態(tài)。數(shù)據(jù)顯示,2023年8月至2024年12月,中國大模型綜合指數(shù)年復(fù)合增長率7.69%,呈現(xiàn)“爆發(fā)增長-震蕩調(diào)整-韌性修復(fù)”的演進格局,政策推動、技術(shù)迭代與資本周期成為關(guān)鍵主導(dǎo)因素。

政策層面央地聯(lián)動:國家網(wǎng)信辦《生成式人工智能服務(wù)應(yīng)急響應(yīng)指南》推動安全合規(guī),工信部《5G揚帆升級方案》等文件加速AI與工業(yè)互聯(lián)網(wǎng)融合;地方政策聚焦算力(天津、山東)、場景(上海金融大模型語料庫)、生態(tài)(廣東大模型開源社區(qū)),初步形成“技術(shù)研發(fā)-合規(guī)治理-產(chǎn)業(yè)協(xié)同”的政策矩陣。

行業(yè)實踐表現(xiàn)分化:備案大模型因政策窗口期呈脈沖式增長(2024年Q4備案數(shù)量環(huán)比增90%),而初創(chuàng)企業(yè)受資本流動影響劇烈波動(2024年4月融資額環(huán)比暴漲73倍)。技術(shù)突破方面,混合專家架構(gòu)(MoE)、低精度訓(xùn)練(FP8)等技術(shù)顯著降低國產(chǎn)大模型訓(xùn)練成本(如DeepSeek訓(xùn)練成本僅為GPT-4的8.8%),中文多模態(tài)、全流程Agent(如Manus)等差異化能力凸顯競爭優(yōu)勢。

挑戰(zhàn)與機遇并存:算力基礎(chǔ)設(shè)施波動與社會創(chuàng)新情緒周期性震蕩倒逼構(gòu)建穩(wěn)定性支撐體系。展望未來,技術(shù)國產(chǎn)化、輕量化與場景專業(yè)化將主導(dǎo)下一階段發(fā)展,而政策需進一步平衡創(chuàng)新激勵與風(fēng)險管理,強化數(shù)據(jù)要素流通與綠色算力協(xié)同能力。

 01 

大模型相關(guān)政策

(一)我國大模型行業(yè)相關(guān)政策

為促進大模型技術(shù)的發(fā)展,我國陸續(xù)發(fā)布了多項行業(yè)政策(如表1-1所示)。

例如,2024年11月,工信部等十二部門發(fā)布《5G規(guī)模化應(yīng)用“揚帆”行動升級方案》,提出支持互聯(lián)網(wǎng)企業(yè)、基礎(chǔ)電信企業(yè)和終端企業(yè)聯(lián)合建設(shè)5G新型應(yīng)用創(chuàng)新工場和體驗中心,開展AI大模型、面向公眾應(yīng)用的網(wǎng)絡(luò)切片等新技術(shù)試點,促進網(wǎng)絡(luò)、內(nèi)容、終端協(xié)同創(chuàng)新,為5G新業(yè)務(wù)新產(chǎn)品研發(fā)提供試驗環(huán)境。

2024年12月,國家網(wǎng)信辦發(fā)布《網(wǎng)絡(luò)安全標準實踐指南——生成式人工智能服務(wù)安全應(yīng)急響應(yīng)指南(征求意見稿)》,提出圍繞生成式人工智能服務(wù)安全事件給出了安全事件的分類和分級建議,并給出了生成式人工智能服務(wù)安全事件應(yīng)急響應(yīng)過程,包括應(yīng)急準備、監(jiān)測預(yù)警、應(yīng)急處置、總結(jié)改進階段的管理措施和技術(shù)方法,可用于指導(dǎo)生成式人工智能服務(wù)提供者提高安全應(yīng)急響應(yīng)能力。

表1-1 我國大模型行業(yè)部分相關(guān)政策(2023年8月-2024年12月)

資料來源:公開渠道,零壹智庫

(二)部分省份大模型行業(yè)相關(guān)政策

為了響應(yīng)國家號召,各省份積極推動大模型行業(yè)的發(fā)展。比如,2024年7月天津市發(fā)布《天津市算力產(chǎn)業(yè)發(fā)展實施方案(2024-2026年)》,提出加快算法模型發(fā)展。發(fā)展計算機視覺、語音語義識別、言語交互等領(lǐng)域算法模型,積極布局通用和垂直行業(yè)大模型,支持高校、企業(yè)和科研機構(gòu)加強基礎(chǔ)理論和共性技術(shù)研究。部分省份大模型主要相關(guān)政策如表1-2所示。

表1-2部分省份大模型行業(yè)部分相關(guān)政策

(2023年8月-2024年12月)

資料來源:公開渠道,零壹智庫

 02 

評價體系

(一)指標體系

本報告延續(xù)前期大模型指數(shù)的指標框架,仍然從大模型研究、大模型實踐和大模型支撐3個一級指標、8個二級指標構(gòu)建指數(shù)。在末級指標上,對兩項指標做了適當(dāng)優(yōu)化和調(diào)整,具體包括:

人才支撐指標優(yōu)化:原“相關(guān)高校數(shù)量”與“相關(guān)專業(yè)數(shù)量”指標因存在顯著同步性,即高校數(shù)量增長與專業(yè)增設(shè)趨勢高度一致,合并為單一“相關(guān)專業(yè)數(shù)量”指標以提升評價效率。

企業(yè)實踐指標完善:保持“初創(chuàng)企業(yè)”和“備案企業(yè)”雙維度評價,其中備案企業(yè)評估新增“備案大模型公眾關(guān)注度”觀測指標,形成更立體的評估視角。

表2-1  中國大模型發(fā)展指數(shù)指標體系

(二)指標權(quán)重

指標權(quán)重的確定有客觀賦權(quán)和主觀賦權(quán)兩類方法?陀^賦權(quán)法可排除主觀干擾,應(yīng)用相對廣泛。熵權(quán)法、標準離差法和CRITIC法是主要的客觀賦權(quán)法,三種方法均用變量的變異確定權(quán)重。其中,CRITIC法考慮了變量之間的沖突,確定的權(quán)重更為精準(Chen et al.,2021;Chen et al.,2022;許滌龍和陳雙蓮,2015)。本報告首先對各指標數(shù)據(jù)進行離差標準化處理,以避免量綱的差異對測算結(jié)果的影響。

本報告選擇CRITIC法確定各指標的權(quán)重。第i個指標的權(quán)重:

根據(jù)上述計算公式,計算各一級指標權(quán)重。

(三)數(shù)據(jù)來源

本指數(shù)所涉數(shù)據(jù)來源于國家統(tǒng)計局、網(wǎng)信辦、教育部、中國知網(wǎng)、中國日報網(wǎng)、智慧芽、企業(yè)預(yù)警通、零壹智庫等。

 03 

大模型指數(shù)總體情況

(一)大模型總指數(shù)年復(fù)合增長率7.69%

2023年8月至2024年12月,大模型指數(shù)呈現(xiàn)“波動式上升”特征。從100增長至326.96,累計增長226.96%,月復(fù)合增長率約7.69%。2023年8月至2024年4月快速上升,指數(shù)從100飆升至217.56,其中2024年4月增速高達35.18%。2024年5月、8月出現(xiàn)明顯回調(diào),增速分別為-13.53%、-1.28%。

圖3-1 大模型指數(shù)與增速

數(shù)據(jù)來源:零壹智庫

1. 2024年4月增速突增原因

一是政策催化。2024年4月,中國工業(yè)和信息化部發(fā)布《人工智能賦能新型工業(yè)化實施方案》,明確提出加速大模型在制造業(yè)的落地應(yīng)用,并通過專項資金支持企業(yè)技術(shù)升級。政策紅利直接刺激市場預(yù)期,推動相關(guān)企業(yè)指數(shù)快速上漲。例如,華為盤古大模型因工業(yè)場景適配獲得多地政府訂單,當(dāng)月訂單金額超10億元。北京、上海等地同期啟動“AI+工業(yè)”試點項目,大模型供應(yīng)商訂單量激增。二是技術(shù)突破與產(chǎn)品發(fā)布。

二是技術(shù)突破與產(chǎn)品發(fā)布。多家頭部企業(yè)發(fā)布新一代大模型產(chǎn)品,參數(shù)規(guī)模與性能顯著提升。例如:百度發(fā)布“文心大模型4.0”,支持多模態(tài)交互,調(diào)用量單月增長120%;騰訊推出金融行業(yè)專用大模型“星脈”,與國有銀行簽訂戰(zhàn)略合作。

三是算力基礎(chǔ)設(shè)施擴容。2024年Q1全國新增智能算力規(guī)模達200EFLOPS,同比增長45%,4月起多地智算中心投入運營,降低企業(yè)訓(xùn)練成本。例如,阿里云宣布大模型訓(xùn)練費用下調(diào)30%,吸引中小企業(yè)加速模型部署。

2. 2024年11月增速突增的原因

一是年底項目沖刺與資本集中投放。11月為傳統(tǒng)“年終預(yù)算執(zhí)行期”,政府與企業(yè)為完成年度目標加速項目落地國有銀行、保險機構(gòu)在年底前集中采購風(fēng)控、客服類大模型服務(wù);地方政府AI專項債資金在Q4密集撥付,推動智慧城市、醫(yī)療等領(lǐng)域需求爆發(fā)。如2024年11月AI招標項目數(shù)量環(huán)比增長68%,金額超200億元。

二是電商與消費場景驅(qū)動。雙十一期間,大模型在營銷、物流、客服等環(huán)節(jié)的應(yīng)用需求激增,如京東“言犀”大模型處理客服咨詢量達日均10億次,同比提升3倍;阿里“通義千問”賦能商家生成個性化廣告素材,覆蓋超50萬店鋪。

三是國際競爭與國產(chǎn)替代加速。2024年10月美國升級AI芯片出口限制,倒逼國內(nèi)企業(yè)加快大模型自主研發(fā),華為昇騰芯片產(chǎn)能11月環(huán)比提升40%,支撐國產(chǎn)大模型訓(xùn)練;百度、科大訊飛等企業(yè)宣布完成“去英偉達化”技術(shù)遷移。

(二)中國大模型研究指數(shù)月復(fù)合增長率達9%

中國大模型研究指數(shù)是由學(xué)術(shù)研究和技術(shù)研究兩個二級指標所構(gòu)成,從計算得出大模型研究指數(shù)從2023年8月92.45增長到2024年12月355.95,增長了263.50點,月復(fù)合9%。大模型研究指數(shù)增長率從15.24%下降到3.83%。

我國大模型研究指數(shù)逐月上升的原因,主要是因為學(xué)術(shù)成果和技術(shù)研發(fā)水平不斷提高所導(dǎo)致。

圖3-2 大模型研究指數(shù)及增長率

數(shù)據(jù)來源:零壹智庫

1.大模型學(xué)術(shù)研究指數(shù)增長率先下降再上升再下降

大模型研究指數(shù)的增長是政策、技術(shù)、市場、產(chǎn)學(xué)研協(xié)同及國際競爭共同作用的結(jié)果,大模型研究中的學(xué)術(shù)研究和技術(shù)研究都在全面發(fā)展,這就導(dǎo)致研究成果豐碩。

從原始數(shù)據(jù)來看,學(xué)術(shù)研究論文數(shù)量從2023年8月412篇增加到了2024年12月的4106篇,增加了3694篇,技術(shù)研究(專利授權(quán)數(shù)量)數(shù)量從23615件增加到53008件,增加了29693件。

從指數(shù)計算結(jié)果我們可以看出大模型研究二級指數(shù)學(xué)術(shù)研究指數(shù)從2023年8月35.72增長到2024年12月的355.95,學(xué)術(shù)研究指數(shù)增長率從2023年08月21.84%增長到2024年7月30.73%后再下降到2024年12月3.61%;技術(shù)研究指數(shù)從2023年8月157.68增長到2024年12月的355.95,技術(shù)研究指數(shù)增長率從13.52%下降到2024年7月-1.03%后再增長到2024年12月4.09%。

大模型學(xué)術(shù)研究指數(shù)增長率先下降再上升再下降的原因,主要是前期的部分研究方向因效果未達預(yù)期而被暫時擱置等導(dǎo)致;中期隨著數(shù)據(jù)中心、智能計算中心、數(shù)字技術(shù)不斷突破等使研究成果顯著;后期隨著中國大模型相關(guān)政策的實施,引發(fā)公眾信任危機,導(dǎo)致部分研究轉(zhuǎn)向安全性與可解釋性優(yōu)化,使研究成果在短期內(nèi)受到一定影響。

2.大模型技術(shù)研究指數(shù)增長率先下降再上升

大模型技術(shù)研究指數(shù)增長率從2023年8月13.52%下降到2024年10月0.27%再上升到2024年12月4.09%,呈現(xiàn)出先下降再上升。

先下降的具體原因算力與資源不足、市場競爭日益激烈、技術(shù)難題等導(dǎo)致;上升的具體原因是新技術(shù)(知識蒸餾)的出現(xiàn)顯著降低訓(xùn)練成本使得中小企業(yè)和學(xué)術(shù)機構(gòu)能夠參與研究,同時提升了應(yīng)用場景的多樣性吸引了更多資本投入等原因?qū)е隆?/p>

圖3-3 大模型學(xué)術(shù)研究指數(shù)和大模型技術(shù)研究指數(shù)及增長率

數(shù)據(jù)來源:零壹智庫

(三)大模型實踐指數(shù)月度復(fù)合增長率達12.21%

大模型實踐指數(shù)從2023年8月的52.54攀升至2024年12月的331.85,實現(xiàn)12.21%的月度復(fù)合增長率。期間經(jīng)歷兩次顯著震蕩:2023年10月和2024年5月分別遭遇52.29%、52.71%的斷崖式下跌;2024年4月與11月則呈現(xiàn)105.74%、180.27%的爆發(fā)式增長。

圖3-4 大模型實踐指數(shù)及增長率

數(shù)據(jù)來源:零壹智庫

1.政策周期主導(dǎo)備案大模型的脈沖式增長

備案大模型指數(shù)與政策監(jiān)管節(jié)奏高度同步,2023年8月《生成式AI服務(wù)管理暫行辦法》實施后,在合規(guī)窗口期觸發(fā)備案大模型的短期爆發(fā)。

備案大模型數(shù)量從8個激增至14個,增幅75%,同步推動備案公司注冊資本增長30.0%,由295萬元增長至384萬元,直接推動當(dāng)月備案大模型指數(shù)暴漲395.67%。2024年11-12月,備案大模型數(shù)量從214個躍升至407個,增幅為90.2%。備案公司注冊資本從2513萬元增至13.6億元,增長441%。

一方面,地方政府在年末產(chǎn)業(yè)規(guī)劃周期中強化前沿技術(shù)布局,通過資質(zhì)審批與財政補貼等引導(dǎo)企業(yè)集中備案,從而促進備案大模型的增長。另一方面,中國石油天然氣集團有限公司等大公司入局,導(dǎo)致大模型備案企業(yè)注冊資本量激增。

圖 3-5 備案大模型指數(shù)及增長率

數(shù)據(jù)來源:零壹智庫

2.資本流動引起初創(chuàng)企業(yè)指數(shù)波動

2024年4月,初創(chuàng)企業(yè)資本金從3月的42.6萬元飆升至3152萬元,增長73.4倍,但次月驟降98.3%,降低至52萬元,同期初創(chuàng)企業(yè)指數(shù)呈現(xiàn)先增長169.84%然后下降60.89%的極端波動,這也導(dǎo)致了大模型實踐指數(shù)在該時期的劇烈波動。

圖3-6 大模型初創(chuàng)企業(yè)指數(shù)及增長率

數(shù)據(jù)來源:零壹智庫

2024年11月,初創(chuàng)企業(yè)資本金環(huán)比增長999%,由29.5萬元增長至3232萬元,資本窗口期效應(yīng)在該月表現(xiàn)尤為顯著。根據(jù)公開數(shù)據(jù),2024年10月,全球AIGC行業(yè)融資總額達到724億元,較9月上升234%(注1)。2024年下半年,海外AIGC產(chǎn)業(yè)鏈企業(yè)獲得融資次數(shù)顯著高于前兩個季度,共有608家海外企業(yè)在年內(nèi)披露了融資。

同時,國內(nèi)AIGC賽道在2024年整體呈現(xiàn)出逐漸活躍的趨勢,前三個季度的融資次數(shù)分別為68、103和171,十一月一批企業(yè)密集完成融資。下半年大模型的密集融資推動初創(chuàng)企業(yè)指數(shù)單月增長211.90%,凸顯資本對技術(shù)里大模型的敏感性。

(四)大模型支撐指數(shù)復(fù)合增長率達8.2%

1.大模型支撐指數(shù)的總體變化特征

大模型支撐指數(shù)從2023年8月的177.81增長至2024年12月的288.49,全年呈現(xiàn)“波動上升”趨勢,年均復(fù)合增長率8.2%,但中間經(jīng)歷多次劇烈震蕩。最明顯的兩次下跌發(fā)生在2023年12月(-15.03%)和2024年2月(-8.70%),而最大漲幅出現(xiàn)在2024年5月2024年12月分別增長16.16%和10.96%。

3-7 大模型支撐指數(shù)及增長率

數(shù)據(jù)來源:零壹智庫

這種波動主要源于算力基礎(chǔ)設(shè)施和大模型創(chuàng)新熱情指數(shù)的不穩(wěn)定。具體來看,算力基礎(chǔ)指數(shù)劇烈波動,單月暴漲1069%或暴跌93%,社會創(chuàng)新熱情大起大落,導(dǎo)致指數(shù)整體“進兩步退一步”的特征。而政策支撐呈現(xiàn)穩(wěn)步增長,人才支撐在一定時期內(nèi)相對穩(wěn)定。由于人才支撐由于高校招生一年一次,導(dǎo)致數(shù)據(jù)在月度研究中相對穩(wěn)定,在此不做分析。

2.算力基礎(chǔ)和社會創(chuàng)新熱情波動加劇大模型支撐指數(shù)震蕩

算力基礎(chǔ)設(shè)施方面,超算中心和智能計算中心數(shù)量整體較少,波動較為平穩(wěn),且均在2024年12月上升至巔峰,均為10個。數(shù)據(jù)中心數(shù)量的劇烈波動造成了算力基礎(chǔ)設(shè)施指數(shù)的震蕩。其中,2024年5月算力指數(shù)暴漲1069%,從17.06升至199.55,推動支撐指數(shù)單月增長16.16%。這源于數(shù)據(jù)中心數(shù)量的距離波動,從15個暴增至134個。

圖3-8 大模型支撐指數(shù)下屬指數(shù)及增長率

數(shù)據(jù)來源:零壹智庫

此外,社會創(chuàng)新熱情指數(shù)大起大落,加劇整體波動性。大模型創(chuàng)新熱情指數(shù)與社交媒體討論量、融資事件等強相關(guān)。其中,2024年3月,大模型創(chuàng)新熱情指數(shù)增長率高達116.69%,可能與該月 Claude 3 Haiku、sora等大模型發(fā)布,以及馬斯克與openai的糾紛等事件有關(guān)。

3.政策支撐穩(wěn)步增長

大模型政策從2023年8月19.56升2024年12月至355.95。大模型治理文件詞頻從6020次增至15834次,翻了2.6倍,是促進大模型支撐指數(shù)增長的穩(wěn)定器。

大模型政總體呈現(xiàn)遞增趨勢,尤其是在研究期早期呈現(xiàn)顯著的增長,2024年之后,隨著政策進步一步完善,大模型政策增長有所放緩。除了數(shù)量增長外,大模型政策內(nèi)容也逐步升級,早期政策側(cè)重“合規(guī)準入”,后續(xù)政策轉(zhuǎn)向“算力調(diào)度”“綠色低碳”等精細化管理。

圖3-9 大模型政策指數(shù)及其增長率

數(shù)據(jù)來源:零壹智庫

 04 

專題一:Deepseek打破

AGI“參數(shù)規(guī)模決定性能”鐵律

DeepSeek是由深度求索(DeepSeek)公司推出的先進大模型系列,自2023年首次亮相以來迅速崛起,通過持續(xù)迭代實現(xiàn)多項技術(shù)突破。

2024年,DeepSeek開源了通用大模型DeepSeek LLM和代碼專用模型DeepSeek Coder,憑借128K長上下文窗口和強大的數(shù)學(xué)推理能力引發(fā)行業(yè)關(guān)注。2025年2月,DeepSeek發(fā)布里程碑式的DeepSeek-V3版本,不僅在MMLU、GPQA等權(quán)威評測中超越GPT-4 Turbo,更以超萬億token的高質(zhì)量訓(xùn)練數(shù)據(jù)和創(chuàng)新的MoE架構(gòu)樹立新標桿。更重要的是,DeepSeek以超低訓(xùn)練成本達到了全球一流水平,改寫了大模型的研發(fā)范式。

DeepSeek的開源策略顯著降低了AI技術(shù)應(yīng)用門檻,推動產(chǎn)學(xué)研協(xié)同創(chuàng)新,同時企業(yè)級API服務(wù)為金融、教育、醫(yī)療等行業(yè)提供了智能化解決方案。該系列通過持續(xù)優(yōu)化模型效率與成本平衡,正在重塑AI商業(yè)化落地范式,成為全球AGN競爭中的重要參與者。

(一)Deepseek優(yōu)勢

1.多模態(tài)支持與中文優(yōu)化

DeepSeek支持文本、圖像、語音等多模態(tài)數(shù)據(jù)處理,并通過中文語料庫的深度優(yōu)化,顯著提升了中文場景下的語義理解和生成質(zhì)量。其“深度思考”功能結(jié)合預(yù)訓(xùn)練知識庫和邏輯推理能力,可對復(fù)雜問題進行多維度分析。

2.混合專家架構(gòu)(MoE)與輕量化部署

采用MoE架構(gòu)(如DeepSeek-V3含6710億參數(shù),每次僅激活370億參數(shù)),動態(tài)路由算法減少計算冗余,配合FP8混合精度訓(xùn)練,顯著降低顯存占用和訓(xùn)練成本(如V3模型訓(xùn)練成本僅557.6萬美元)。支持本地化部署,可在消費級硬件(如RTX 4090)運行。

3.強化學(xué)習(xí)驅(qū)動的推理能力

通過純強化學(xué)習(xí)(如GRPO算法)實現(xiàn)推理能力自主進化,無需依賴監(jiān)督微調(diào)(SFT),在數(shù)學(xué)解題、代碼生成等復(fù)雜任務(wù)中表現(xiàn)優(yōu)異。

4.開源生態(tài)與低成本API

開源1.5B至70B參數(shù)模型及工具鏈(支持FP8量化、動態(tài)負載監(jiān)控),并提供每百萬tokens僅0.48美元的API服務(wù),成本僅為OpenAI的2%-5%。

表4-1 deepseek與國外競品比較

資料來源:公開渠道,零壹智庫

(二)DeepSeek的行業(yè)影響

1.軟件開發(fā)效率的革新

DeepSeek通過開源模型權(quán)重和代碼補全工具,顯著降低了開發(fā)門檻,使中小企業(yè)和個人開發(fā)者能夠快速構(gòu)建定制化應(yīng)用。其代碼補全工具在過去12周內(nèi)用戶量增長72%,直接沖擊傳統(tǒng)網(wǎng)頁開發(fā)、應(yīng)用開發(fā)領(lǐng)域,自由開發(fā)者需轉(zhuǎn)向更高階的創(chuàng)意或架構(gòu)設(shè)計以保持競爭力。

開源生態(tài)吸引了全球開發(fā)者參與優(yōu)化,例如華為云、阿里云等平臺集成DeepSeek模型后,開發(fā)者可一鍵調(diào)用API,加速產(chǎn)品迭代。此外,模型蒸餾技術(shù)允許企業(yè)從大模型中提取輕量化版本,進一步適配資源有限的小團隊需求。

2.教育行業(yè)的智能化轉(zhuǎn)型

生成式AI工具(如問答助手)導(dǎo)致傳統(tǒng)教育平臺流量下滑,用戶轉(zhuǎn)向AI驅(qū)動的個性化學(xué)習(xí)方案。例如,北森控股推出AI招聘助手、智能面試官等工具,結(jié)合DeepSeek模型提升招聘效率;Boss直聘通過自研模型優(yōu)化簡歷匹配和面試輔導(dǎo),縮短招聘周期至數(shù)分鐘。教育模式從標準化內(nèi)容分發(fā)轉(zhuǎn)向自適應(yīng)學(xué)習(xí),AI可根據(jù)學(xué)生能力動態(tài)調(diào)整教學(xué)路徑,降低教師重復(fù)性工作負擔(dān)。

3.制造業(yè)的流程優(yōu)化與成本控制

DeepSeek大模型助力制造業(yè)實現(xiàn)生產(chǎn)流程智能化,例如景業(yè)智能通過部署AI優(yōu)化機器人控制與信息化管理,提升生產(chǎn)線效率;華為云與徐工集團合作開發(fā)工業(yè)大模型,實時分析設(shè)備數(shù)據(jù)以減少停機時間。物流領(lǐng)域,順豐利用AI優(yōu)化配送路徑,降低運營成本20%以上。此類應(yīng)用推動制造業(yè)從“經(jīng)驗驅(qū)動”轉(zhuǎn)向“數(shù)據(jù)驅(qū)動”,減少對人工經(jīng)驗的依賴。

4.創(chuàng)意產(chǎn)業(yè)的效率與內(nèi)容革新

DeepSeek的圖像生成工具簡化了設(shè)計流程,沖擊傳統(tǒng)設(shè)計平臺(如Figma),但也為Canva等工具提供了功能擴展機會。AI在文案生成、視頻剪輯等領(lǐng)域的應(yīng)用,替代了部分基礎(chǔ)創(chuàng)意工作,例如營銷文案生成效率提升50%,但需人類審核以規(guī)避“幻覺”風(fēng)險。AI同時為創(chuàng)作者提供數(shù)據(jù)驅(qū)動的靈感支持,例如通過分析用戶偏好生成定制化內(nèi)容。

5.芯片行業(yè)的國產(chǎn)化與生態(tài)重構(gòu)

DeepSeek的優(yōu)化技術(shù)(如FP8混合精度訓(xùn)練)降低了推理階段的算力需求,推動市場從訓(xùn)練芯片向推理芯片轉(zhuǎn)移,威脅英偉達的壟斷地位。國產(chǎn)芯片廠商(如華為昇騰)加速適配低精度運算需求,出貨量增長超30%。開源模型還促進軟硬件協(xié)同創(chuàng)新,例如景業(yè)智能的本地化部署案例推動邊緣計算芯片需求,形成國產(chǎn)算力生態(tài)閉環(huán)。

 05 

專題二:Manus重構(gòu)

人類與機器在復(fù)雜系統(tǒng)的共生范式

2025年3月5日,中國AI創(chuàng)業(yè)公司蝴蝶效應(yīng)(Butterfly Effect)正式發(fā)布了全球首款通用AI智能體產(chǎn)品——Manus,標志著智能體技術(shù)邁入全新階段。Manus基于革命性的"神經(jīng)符號協(xié)同架構(gòu)",首次實現(xiàn)了大語言模型的推理能力與專業(yè)智能體執(zhí)行系統(tǒng)的完美融合。Manus的核心優(yōu)勢在于其自主規(guī)劃任務(wù)并實時調(diào)整的能力,能夠在沒有預(yù)先規(guī)劃的情況下完成復(fù)雜任務(wù)。

Manus開放平臺已吸引超過300家制造業(yè)、醫(yī)療和服務(wù)業(yè)企業(yè)接入,正在重塑從工業(yè)自動化到家庭服務(wù)的全場景智能生態(tài)。

(一)Manus優(yōu)勢

1.全流程自主任務(wù)執(zhí)行能力

Manus是一款通用型AI Agent,能夠獨立完成從任務(wù)規(guī)劃到執(zhí)行的全流程操作,例如撰寫報告、股票分析、旅行規(guī)劃等。其核心在于將用戶指令轉(zhuǎn)化為具體行動,直接交付成果(如可視化圖表、代碼文件、分析報告等),而非僅提供建議。例如,在簡歷篩選中,Manus可自動解壓文件、逐頁分析、生成候選人排名。

2.多智能體協(xié)同架構(gòu)

采用多代理系統(tǒng)(MAS),各子代理運行于獨立虛擬機中,分別負責(zé)規(guī)劃、執(zhí)行、驗證等環(huán)節(jié),模擬人類“Plan-Do-Check-Act”工作流。這種架構(gòu)提升了任務(wù)分解與并行處理能力,同時確保不同任務(wù)間的隔離與安全性。

3.強大的工具調(diào)用與集成能力

Manus可靈活調(diào)用代碼編輯器、瀏覽器、文檔處理器等工具,支持自動化代碼編寫、網(wǎng)頁爬取、文件操作等復(fù)雜操作。例如,在房產(chǎn)分析中,它能通過Python計算預(yù)算、抓取房源數(shù)據(jù)并生成多維度報告。

4.自主學(xué)習(xí)與記憶優(yōu)化

內(nèi)置長短期記憶模塊,可記錄用戶偏好(如輸出格式偏好)并優(yōu)化后續(xù)任務(wù)執(zhí)行策略。例如,用戶若偏好圖表呈現(xiàn),Manus會在同類任務(wù)中自動調(diào)整結(jié)果展示方式。

5.技術(shù)性能領(lǐng)先

在GAIA基準測試中,Manus的Level 1-3任務(wù)處理能力均達到SOTA(State-of-the-Art),性能超越OpenAI的DeepResearch等同類模型。

表5-1 Manus與國外競品比較

資料來源:公開渠道,零壹智庫

(二)Manus的行業(yè)影響

1.技術(shù)范式革新

Manus的"神經(jīng)符號協(xié)同架構(gòu)"突破了傳統(tǒng)AI智能體的局限性,將大語言模型的泛化能力與專業(yè)領(lǐng)域執(zhí)行系統(tǒng)相結(jié)合,實現(xiàn)了從"單任務(wù)自動化"到"多場景自主決策"的跨越。其動態(tài)技能擴展機制為智能體賦予了持續(xù)進化的可能,推動行業(yè)從靜態(tài)規(guī)則驅(qū)動轉(zhuǎn)向自適應(yīng)學(xué)習(xí)驅(qū)動的技術(shù)范式。

2.產(chǎn)業(yè)應(yīng)用變革

在制造業(yè)領(lǐng)域,Manus智能體已實現(xiàn)從產(chǎn)線質(zhì)檢到供應(yīng)鏈調(diào)度的全流程自主優(yōu)化,某汽車工廠部署后生產(chǎn)效率提升40%;在服務(wù)業(yè),其多模態(tài)交互能力使客服、導(dǎo)購等場景的響應(yīng)準確率達到人類專家水平。這種跨行業(yè)的滲透正在重新定義"自動化"的邊界,催生"智能體即服務(wù)"(Agent-as-a-Service)的新商業(yè)模式。

3.生態(tài)重構(gòu)與標準競爭

Manus開放平臺吸引了全球開發(fā)者共建技能庫,其模塊化設(shè)計降低了智能體開發(fā)門檻,形成類似"App Store"的生態(tài)體系。這一策略加速了行業(yè)從封閉系統(tǒng)向開放協(xié)作轉(zhuǎn)型,同時使中國首次在智能體技術(shù)標準制定中掌握話語權(quán),動搖了西方企業(yè)在AI基礎(chǔ)設(shè)施層的主導(dǎo)地位。

4.人機關(guān)系重塑

Manus構(gòu)建了全新的"智能伙伴"交互范式。傳統(tǒng)AI系統(tǒng)作為被動工具需要精確指令,而Manus通過多模態(tài)感知和意圖理解技術(shù),實現(xiàn)了對人類模糊需求的"心智化"解讀——當(dāng)用戶說"幫我處理這個麻煩事"時,它能結(jié)合上下文自動識別"麻煩事"具體指代的工作瓶頸還是家庭矛盾,并給出針對性解決方案。

5.改變?nèi)駻I競爭格局

Manus的快速商業(yè)化驗證了通用智能體的可行性,迫使谷歌、Meta等巨頭加速相關(guān)布局。其在中國市場的先發(fā)優(yōu)勢,助力本土產(chǎn)業(yè)鏈在智能制造、智慧城市等領(lǐng)域形成差異化競爭力,可能改變?nèi)駻I產(chǎn)業(yè)的價值分配格局。

 06 

總結(jié)與展望

(一)總結(jié)

1.政策驅(qū)動下的多維度布局

政策重心從“合規(guī)準入”(如《生成式AI服務(wù)管理暫行辦法》)轉(zhuǎn)向“生態(tài)構(gòu)建”和“場景深耕”(如廣東聚焦開源社區(qū)、上海建立金融大模型語料庫)。地方政策強化差異化競爭,寧夏利用算力補貼吸引數(shù)據(jù)中心,山西推動礦山安全大模型研發(fā),形成“國家統(tǒng)籌+地方專精”的協(xié)同路徑。

2.技術(shù)突破與成本重構(gòu)

混合專家架構(gòu)(MoE)、動態(tài)路由技術(shù)(如DeepSeek-V3)使大模型參數(shù)激活效率提升5-10倍,訓(xùn)練成本降低80%以上(從GPT-4的6300萬美元降至500萬美元級)。國產(chǎn)自主化進程加速,華為昇騰芯片產(chǎn)能提升40%,F(xiàn)P8低精度訓(xùn)練等技術(shù)推動推理成本降至國際競品的1/20。

3.實踐落地的兩極分化

備案模型爆發(fā),2024年Q4新增備案模型193個(環(huán)比+90%),主要集中于金融風(fēng)控、政務(wù)客服等高合規(guī)需求場景。初創(chuàng)企業(yè)高波動,2024年4月單月融資額環(huán)比增73倍,但次月驟降98.3%,反映資本對大模型研發(fā)周期與商業(yè)化落地效率的審慎評估,短期投機性注資與長期價值錨定尚未形成有效平衡。

4.支撐體系的脆弱性暴露

算力基礎(chǔ)設(shè)施增長依賴脈沖式投入(如2024年5月數(shù)據(jù)中心數(shù)量單月增780%),社會創(chuàng)新熱情易受國際技術(shù)事件(如Sora發(fā)布)擾動。折射出數(shù)字基建與創(chuàng)新生態(tài)的結(jié)構(gòu)性失衡,算力供給的脈沖式躍進難以支撐可持續(xù)創(chuàng)新韌性,國際技術(shù)事件的應(yīng)激性擾動突顯自主創(chuàng)新鏈成熟度不足。

(二)展望

1.技術(shù)革新驅(qū)動“三化”趨勢

一是AI Agent輕量化。MoE架構(gòu)+低比特量化(如4-bit權(quán)重)推動百億參數(shù)模型在手機、IoT設(shè)備端運行,催生“個人AI代理”時代。

二是能力升級自主化。強化學(xué)習(xí)(如GRPO算法)與神經(jīng)架構(gòu)搜索(NAS)結(jié)合,實現(xiàn)模型推理能力的動態(tài)優(yōu)化,適用于實時決策場景(如自動駕駛、高頻交易)。

三是多模態(tài)融合深度化。視頻生成大模型(對標Sora)、3D建模大模型(如3D-GPT)將突破文本-圖像的單向交互,構(gòu)建沉浸式工業(yè)設(shè)計、元宇宙社交新范式。

2.新范式重構(gòu)產(chǎn)業(yè)邏輯

一是AI Agent生態(tài)崛起。以Manus為代表的全流程Agent將滲透企業(yè)核心業(yè)務(wù)流。例如,金融領(lǐng)域?qū)崿F(xiàn)“自動財報分析→風(fēng)險預(yù)警→投資決策”閉環(huán),工業(yè)場景支持“需求感知→智能排產(chǎn)→故障自修復(fù)”。開源Agent框架(如AutoGPT)降低開發(fā)門檻,預(yù)計2025年全球Agent經(jīng)濟規(guī)模將突破千億美元。

二是存算一體架構(gòu)革命;趹涀杵、光子芯片的存算一體技術(shù),將解決傳統(tǒng)馮·諾依曼架構(gòu)的“內(nèi)存墻”問題,支持EB級模型的實時推理(能效比提升100倍)。

3、政策與產(chǎn)業(yè)協(xié)同的關(guān)鍵方向

一是綠色算力網(wǎng)絡(luò)建設(shè)。結(jié)合液冷技術(shù)(PUE<1.1)與西部可再生能源,構(gòu)建“東數(shù)西算—低碳智算”一體化基礎(chǔ)設(shè)施,支撐萬億參數(shù)模型的可持續(xù)發(fā)展。

二是數(shù)據(jù)要素市場化突破。通過聯(lián)邦學(xué)習(xí)+區(qū)塊鏈技術(shù)建立跨行業(yè)數(shù)據(jù)沙盒,推動醫(yī)療、交通等領(lǐng)域的大模型訓(xùn)練合規(guī)化。

三是安全治理體系升級。動態(tài)風(fēng)險監(jiān)測(如AIGC深度偽造溯源)、對抗攻擊防御技術(shù)將成為大模型服務(wù)的標配能力。

四是AI原生硬件突破。專為大模型優(yōu)化的三進制芯片、光子計算卡、神經(jīng)形態(tài)芯片量產(chǎn),支撐ZettaFLOP級算力需求。中國將有機會在全球AI硬件競賽中開辟“第二戰(zhàn)場”,推動大模型研發(fā)從“依賴制程工藝”轉(zhuǎn)向“架構(gòu)定義規(guī)則”的新階段。

注:1、2024年11月全球AIGC投融資報告-End-

(點擊文末閱讀原文,可查看PDF報告)

       原文標題 : 2024年中國大模型發(fā)展指數(shù)報告(總第3期)

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號