訂閱
糾錯(cuò)
加入自媒體

春節(jié)AI風(fēng)暴:AI走出幼年期

圖片

來源 | 伯虎財(cái)經(jīng)(bohuFN)

作者 | All too well 

今年2月,當(dāng)恒生科技指數(shù)還處在一路向南的慘淡當(dāng)中時(shí),有兩個(gè)“小登”走出了不一樣的行情。上市兩個(gè)月的智譜從一月底的226.4港元每股一路飆升到發(fā)稿前的628港元每股;上市不過一個(gè)半月的MiniMax從一月底的473港元每股上漲到發(fā)稿前的880港元每股。

兩家公司市值均一度跨過3000億港元關(guān)口。

3000億港元是什么概念?橫向?qū)Ρ纫幌戮秃苤庇^——當(dāng)前B站總市值957.17 億港元,京東市值約為3016.79億港元。也就是說,這兩家成立還尚不足十年的AI公司,市值已經(jīng)悄然越過許多互聯(lián)網(wǎng)巨頭。

和“小登”在二級(jí)市場予取予求不同,大廠們正忙著讓更多人用上AI。

今年春節(jié),字節(jié)、阿里和騰訊紛紛取消了春節(jié)休假,嚴(yán)陣以待,應(yīng)對(duì)用重金換來的AI需求。在各家的戰(zhàn)報(bào)里,僅除夕當(dāng)天,豆包 AI 互動(dòng)總次數(shù)達(dá)到 19 億次;阿里花費(fèi)30億元,讓近 2 億用戶使用千問下單消費(fèi);騰訊用10億紅包,換來了1.14 億的月活新高。

這是大廠們2026年的第一波交鋒。如何撬動(dòng)和發(fā)現(xiàn)更多的需求?如何先人一步的占據(jù)AI時(shí)代的入口?這是大廠們關(guān)心的問題。

無論是大廠們的撒幣買用戶,還是二級(jí)市場上的AI“小登”當(dāng)?shù)溃际茿I時(shí)代里的不同切口。毫無疑問的是,AI應(yīng)用已經(jīng)開始深入融合我們的生活,它既站在港股AI“小登”的升浪中,也藏身在大廠的FOMO情緒里,催促后者把它推向每一個(gè)人。

01 2026,AI商業(yè)化元年?

MiniMax和智譜的狂飆之所以讓不少人擔(dān)憂,很大程度上是因?yàn)樗麄兊氖兄禑o法適用于傳統(tǒng)的估值模型。

即便是把它們放到AI企業(yè)的籃子里,也屬于是被嚴(yán)重高估的。美國同行Anthropic 最新估值約 3800 億美元,年化收入已經(jīng)超過 20 億美元,市銷率大約 190 倍。而如果以MiniMax前九個(gè)月5344 萬美元對(duì)應(yīng)的3000億港元營收來算,后者的市銷率超過 700 倍。

但推動(dòng)MiniMax和智譜這波上漲的重要原因是,它們的新模型證明了中國AI團(tuán)隊(duì)有能力用算法效率彌補(bǔ)硬件短板,做出讓專業(yè)用戶為之付費(fèi)、好用的模型。

以智譜為例。

程序員一直是AI的重要付費(fèi)群體,此前大火的vibe coding就是讓AI作為產(chǎn)出工具來完成寫代碼的工作。但在全球權(quán)威編程基準(zhǔn)測試?yán),閉源模型的領(lǐng)先一直很明顯。

智譜新發(fā)布的GLM-5打破了這個(gè)慣例,從Artificial Analysis測試的結(jié)果來看,GLM-5直接躋身智能程度全球第4,編程能力全球第6,代理能力全球第3,緊追頂尖的閉源模型。而在AA-Omniscience幻覺率測試中,GLM-5把幻覺率壓縮至34%。

圖片圖片

除了在推理、代碼和自主能力上的全面升級(jí),GLM-5還大幅降低了運(yùn)行成本。GLM-5引入的深度稀疏注意力機(jī)制讓它能夠根據(jù)內(nèi)容智能篩選出最重要的詞,舉個(gè)例子,同樣是12.8萬個(gè)詞的長文本,GLM-5的計(jì)算量直接砍掉了一半到三分之二。因此,GLM-5的參數(shù)總量擴(kuò)展到了7440億,但每次實(shí)際激活運(yùn)算的參數(shù)只有400億。

新模型發(fā)布后,由于用戶規(guī)模與調(diào)用量快速提升,智譜還官宣GLM Coding Plan價(jià)格上調(diào)30%以上。主打輕量化和效率的MiniMax M2.5在被以O(shè)penClaw為代表的Agent需求推動(dòng)下,只用了一個(gè)星期的時(shí)間,就成了OpenRouter上Tokens調(diào)用量的榜一。

不再追求模型參數(shù),而是讓用戶真正用起來,這和過去我們熟悉的AI廠商開打價(jià)格戰(zhàn)的競爭態(tài)勢是截然不同的。

即便是仍然花大價(jià)錢買用戶的大廠們,實(shí)際上競爭的也是好用。

晚點(diǎn)LatePost報(bào)道,2025 年初,字節(jié)跳動(dòng) CEO 梁汝波曾在集團(tuán)全員會(huì)上說,豆包沒顯出 “越多人用越好用” 的互聯(lián)網(wǎng)產(chǎn)品特性,他提出字節(jié)要追求智能上限。春節(jié)前,Doubao2.0升級(jí),除夕當(dāng)天,Qwen3.5上線。兩者同樣強(qiáng)調(diào)Agent執(zhí)行能力,能辦事,真有用。視頻生成模型Seedance2.0發(fā)布后,游戲科學(xué)CEO、《黑神話:悟空》制作人馮驥更是發(fā)出了“AIGC的童年時(shí)代,結(jié)束了”的感嘆。

和小登們不同的是,這些擁有龐大生態(tài)、版圖從電商、生活服務(wù)蔓延到短視頻、游戲乃至支付巨頭們,還需要借由AI繼續(xù)鞏固自己的地位。

所以千問接入了淘寶閃購、支付寶、淘寶、飛豬、高德等阿里系應(yīng)用,為了讓千問的使用體驗(yàn)更好,阿里投入了大量資源,每周更新2-3 次,一些需求從設(shè)計(jì)到上線僅需 1-3 天。

無論是智譜和MiniMax的搶跑,還是大廠的紅包大戰(zhàn),其實(shí)都在面向不同的人群,努力讓AI真正被用起來。

02 繁榮背后的隱憂

OpenRouter數(shù)據(jù)顯示,今年2月第一周處理的AI tokens達(dá)到13萬億,環(huán)比1月第一周接近翻倍。這和當(dāng)下行業(yè)的Agent爆發(fā)式增長有很大關(guān)系。

在海外,OpenClaw作為一款開源的個(gè)人AI助手,能夠在本地電腦或服務(wù)器上自主運(yùn)行,并通過自然語言指令執(zhí)行各種任務(wù)。它的爆火速度堪稱史詩級(jí),其在發(fā)布后的短短一周內(nèi)就突破10 萬顆星標(biāo),成為GitHub歷史上增速最快、關(guān)注度最高的開源項(xiàng)目之一。

雖然當(dāng)下處于墻內(nèi)墻外兩開花的狀態(tài),但AI應(yīng)用還存在不少隱憂。

首先,高投入高虧損是行業(yè)常態(tài),以智譜和MINIMAX為例。

2022—2024年、2025年上半年,智譜的營收分別為0.57億元、1.25億元、3.12億元、1.91億元,凈利潤分別為-1.43億元、-7.88億元、-29.56億元、-23.51億元,三年半虧損62.38億元。

2022—2024年、2025年前三季度,MINIMAX營收分別為0、0.03億美元、 0.31億美元、0.53億美元,分別實(shí)現(xiàn)凈利潤-0.74億美元、-2.69億美元、-4.65億美元、-5.12億美元,三年又三個(gè)季度合計(jì)虧損13.2億美元。

虧損主要出在人力成本和算力成本。據(jù)海豚投研分析,兩個(gè)公司員工整體都沒超1000人,尤其是Minimax都不足400人;兩家公司研發(fā)人員都接近75%,單人頭月成本6.5-8.5萬元人民幣(不含期權(quán)激勵(lì)),其中Minimax研發(fā)人員單人月成本是16萬。

看著不低的人力成本,但和動(dòng)不動(dòng)上億美金搶人大戰(zhàn)的慘烈比起來,又不算離譜。真正的壓力來自算力。

從兩家公司披露的數(shù)據(jù)來看,單單模型訓(xùn)練相關(guān)的算力投入,就占到了總支出的 50% 以上,是絕對(duì)的大頭,也是虧損的核心來源。

以 2023 年為例,研發(fā)一代模型的訓(xùn)練成本大約在四五千萬美元之間。而當(dāng)模型進(jìn)入下一代,為了實(shí)現(xiàn)代際差異,無論是數(shù)據(jù)量、參數(shù)規(guī)模還是算力需求,往往都呈現(xiàn)指數(shù)級(jí)增長。模型升級(jí)一代,訓(xùn)練成本提高 3—5 倍幾乎是常態(tài)。

也就是說,算力效率提升了,但算力總需求卻在放大。

一方面,模型規(guī)模持續(xù)膨脹,多模態(tài)能力不斷疊加;另一方面,Agent、編程助手等高頻場景開始落地,調(diào)用次數(shù)迅速上升。在這種情況下,即便單次 token 成本快速下行,只要總調(diào)用量和模型復(fù)雜度同步飆升,企業(yè)最終要支付的算力總賬單,反而可能越滾越大。

這也解釋了,為什么推理成本明明在下降,公司燒錢卻越來越厲害。

根據(jù)灼識(shí)咨詢數(shù)據(jù),行業(yè)平均推理成本已從2022年底每百萬 token 約 20 美元降至 2024 年底不足 0.1 美元,未來仍可能繼續(xù)下降。單次調(diào)用確實(shí)更便宜了。

與此同時(shí),2024 年,MiniMax 與推理及訓(xùn)練相關(guān)的云計(jì)算成本合計(jì)約 1.67 億美元,占營收比例達(dá) 545%。也就是說,每賺1塊錢,要付出 5 塊多的算力費(fèi)用。智譜當(dāng)年計(jì)算與算力服務(wù)費(fèi)合計(jì) 15.83 億元,占營收 506%。每進(jìn)賬 1 塊錢,大約 5 塊被算力吞掉。

而且這種趨勢還愈演愈烈。智譜的算力服務(wù)費(fèi)占研發(fā)開支比例,從 2022 年的 17.3%,一路爬升到 2025 年上半年的 71.8%;MiniMax 與訓(xùn)練相關(guān)的云計(jì)算開支占研發(fā)比例,也從 39.4% 提升至接近 80%。

這就意味著,目前的情況下,模型要優(yōu)秀,訓(xùn)練成本就越高,收入似乎也跟不上更新迭代的速度,到底何時(shí)才會(huì)有個(gè)結(jié)果?

其次是監(jiān)管和侵權(quán)風(fēng)險(xiǎn)。比如Seedance2.0不僅收到了來自版權(quán)方的律師函,還下線了爭議極大的真人素材參考能力。

浪潮之下,畢其功于一役是不切實(shí)際的想法。AI的參與者們面臨的是一場真實(shí)的商業(yè)戰(zhàn)爭,而剛剛過去的春節(jié)可能只不過是一道開胃前菜罷了。

參考來源:

1、至頂AI實(shí)驗(yàn)室:智譜GLM-5技術(shù)曝光,代碼能力已經(jīng)趕上Claude?

2、硅基星芒:智譜與Minimax交出“大招”之后,DeepSeek“平A”了一下

3、晚點(diǎn)AI:春節(jié) AI 戰(zhàn)役全記錄:紅包、模型與算力

4、字母AI:跟Claude掰腕子,智譜MiniMax雙模齊發(fā)

5、海豚投研:深扒Minimax與智譜:大模型,一場算力強(qiáng)度與融資耐力的殘酷絕殺?

6、極客公園:為什么所有人都覺得MiniMax、智譜「太貴了」?

7、厚雪研究:中國“大模型雙雄”上市:研發(fā)支出70%-80%花在算力

文章封面首圖及配圖,版權(quán)歸版權(quán)所有人所有。若版權(quán)者認(rèn)為其作品不宜供大家瀏覽或不應(yīng)無償使用,請(qǐng)及時(shí)聯(lián)系我們,本平臺(tái)將立即更正。

       原文標(biāo)題 : 春節(jié)AI風(fēng)暴:AI走出幼年期

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)