訂閱
糾錯
加入自媒體

AI Coding分水嶺:狂卷參數(shù)的背后,生態(tài)標(biāo)準(zhǔn)之戰(zhàn)才剛開始

2025-12-08 11:37
智百道
關(guān)注

圖片

文 / 道哥 

來源 / 智百道 

AI Coding正無可爭議地成為人工智能領(lǐng)域商業(yè)化最先落地的賽道。

據(jù)研究機(jī)構(gòu)Market Research Future預(yù)測,AI編程工具市場將從2025年的151.1億美元增長到2034年的991億美元,CAGR達(dá)到23.24%。

在今年5月舉辦的Meta LlamaCon大會上,微軟CEO納德拉表示,現(xiàn)在微軟30%的代碼都是AI寫的。微軟首席技術(shù)官凱文斯科特曾預(yù)測,到2030年95%的代碼將由AI生成。

再看中國市場,工信部發(fā)布的數(shù)據(jù)顯示,2024年前三季度,我國軟件業(yè)務(wù)收入98281億元,同比增長10.8%;這都有可能轉(zhuǎn)為AI編程的潛在市場空間。

面對萬億級的商業(yè)前景,中國模型正在上演一場驚心動魄的參數(shù)追擊戰(zhàn)。

以DeepSeek-V3.2(12月1日推出)為例,衡量大模型代碼工程任務(wù)解決能力的SWE Verified達(dá)到了73.1%,逼近Anthropic旗下的Claude-4.5-Sonnet(9月29日推出)的74.9%。

在《智百道》看來,僅僅盯著數(shù)字的差距,或許會讓我們錯失戰(zhàn)局的真相。中美AI編程的勝負(fù)手,或許正在從參數(shù)性能轉(zhuǎn)向生態(tài)標(biāo)準(zhǔn)。

01 國模開源搞基建,美國閉源賣性能

圖片

長久以來,編程被定義為一種嚴(yán)謹(jǐn)?shù)、邏輯?qū)動工作,能將人類意圖轉(zhuǎn)化為機(jī)器可理解并執(zhí)行的語言。也是因?yàn)檫@種嚴(yán)謹(jǐn)?shù)囊蚬壿,對于時下主流的LLM來說,編程是PMF最好的領(lǐng)域。

在AI Ascent 2025上,紅杉資本直言,AI Coding是第一個被顛覆的市場,這也將成為未來其他行業(yè)AI化進(jìn)程的重要先兆。

在這個高付費(fèi)意愿的領(lǐng)域,中國與美國走上了兩條路。

美國是精英化的閉源路線,靠著不俗的模型性能博得資本市場青睞,撐起了驚人的市值。

AI編程工具 Cursor 近期宣布完成23億美元D輪融資,股東名單集結(jié)了Google、英偉達(dá)等頭號玩家,其母公司 Anysphere 估值在四個月內(nèi)翻了3倍,達(dá)到293億美元。而在B端市場攻城略地的 Anthropic,估值更是飆升至3500億美元。

其于11月25日新推出的 Claude Opus 4.5,在 SWE-Bench Verified 測試中突破 80.9%,不僅超越了 Gemini-3 Pro 和 GPT-5.1,更是首個在該指標(biāo)上達(dá)到80分的大模型,標(biāo)志著AI的代碼修正能力已具備甚至超越人類專家的水準(zhǔn)。

更有殺傷力的是價格戰(zhàn)。Claude Opus 4.5 的 API 定價降至每百萬 tokens 5美元(輸入)/25美元(輸出),相比上一代直接砍去了三分之二。

相比之下,中國模型走出了截然不同的開源+性價比路線。

今年,DeepSeek 的R1橫空出世,不僅拉升了國產(chǎn)模型的基準(zhǔn)線,更奠定了中國廠商的開源基調(diào)。經(jīng)過一年角逐,以 Kimi、Qwen、GLM 為首的國產(chǎn)模型軍團(tuán),在參數(shù)表現(xiàn)上已能幾乎與海外頂尖模型分庭抗禮。

以DeepSeek 在12月1日新推出的V3.2為例,SWE Verified達(dá)到了73.1%,逼近Anthropic旗下Claude-4.5-Sonnet(9月29日推出)的74.9%,這體現(xiàn)出了開源+性價比的可行性。

路線不同也決定了雙方的受眾并不同。

財富雜志此前報道,許多歐美高管傾向于OpenAI、Anthropic或谷歌等公司專有模型的性能優(yōu)勢。

而亞洲市場則更務(wù)實(shí),數(shù)據(jù)主權(quán)和成本控制是核心考量。

中國人工智能云托管服務(wù)商硅基流動的聯(lián)合創(chuàng)始人兼首席執(zhí)行官袁進(jìn)輝表示,該公司開發(fā)了多種技術(shù),能更經(jīng)濟(jì)高效地運(yùn)行開源模型,這意味著使用開源模型完成任務(wù)的成本遠(yuǎn)低于采用專有人工智能模型。此外,他還表示,如果針對特定應(yīng)用場景,利用自有數(shù)據(jù)對開源模型進(jìn)行微調(diào),其性能表現(xiàn)能超越專有模型并完全避免敏感數(shù)據(jù)或商業(yè)機(jī)密泄露的風(fēng)險。

祥峰投資控股公司的陳逸邦強(qiáng)調(diào),雖然專有模型供應(yīng)商也會為企業(yè)提供基于自有數(shù)據(jù)的微調(diào)服務(wù),通常還會承諾不將這些數(shù)據(jù)用于更廣泛的訓(xùn)練,但真實(shí)情況如何我們無從得知。

開源模型允許開發(fā)者免費(fèi)下載、修改和集成,初創(chuàng)企業(yè)更易開發(fā)產(chǎn)品,也使研究人員更易改進(jìn)模型。其廣泛應(yīng)用正對人工智能未來走向產(chǎn)生巨大影響,這一邏輯正在全球范圍內(nèi)生效。

新加坡國家人工智能計劃(AISG)近期的戰(zhàn)略調(diào)整最具標(biāo)志性,其最新版東南亞語言大模型"Sea-Lion"宣布棄用Meta,轉(zhuǎn)而基于阿里的Qwen架構(gòu)構(gòu)建。這代表中國開源模型已開始在全球技術(shù)版圖中憑借實(shí)用主義突圍。

過去一年,中國團(tuán)隊自主研發(fā)的開源AI模型下載份額占比已上升至17.1%,首次超過美國的15.8%。麻省理工學(xué)院與Hugging Face數(shù)據(jù)顯示,DeepSeek和阿里巴巴的千問模型,占據(jù)中國模型下載量的絕大多數(shù)。

02 我們在造車,美國在修路

圖片

隨著大模型迭代速度的放緩,在參數(shù)上,國內(nèi)逼近甚至追平美國頂尖模型或許只是時間問題,但從另一個角度看,海外領(lǐng)先的或許不只有模型的工程化能力,而是生態(tài)的護(hù)城河。

在《智百道》看來,以Anthropic為首的頂級模型廠商在試圖定義智能體時代的HTTP。

今年2月,Anthropic推出Claude Code。這不僅僅是一個工具,而是原生的IDE系統(tǒng)。與 Cursor等"套殼"IDE 不同,Claude Code實(shí)現(xiàn)了模型與開發(fā)環(huán)境的深度解耦與重構(gòu)。它能直接理解代碼庫、管理上下文,并調(diào)用第三方工具。

僅僅4個月,Claude Code 就吸引了11.5萬名開發(fā)者。Menlo Ventures 預(yù)測,僅此一款產(chǎn)品就能為Anthropic貢獻(xiàn)1.3億美元收入。

此外,Google 推出了A2A開放協(xié)議,支持模型到模型的互操作性,解決不透明代理系統(tǒng)之間的黑盒狀態(tài)。

眾所周知,每個模型都各有所長,在實(shí)際應(yīng)用場景中,開發(fā)者往往需要調(diào)用不同模型來共同實(shí)現(xiàn)目標(biāo)。A2A協(xié)議支持用戶在執(zhí)行任務(wù)時,支持用戶調(diào)用不同大模型生成不同的Agent共同完成特定目標(biāo)。

如果說與A2A是指在貫通模型之間的合作,那么與其互補(bǔ)的是MCP。

2024年11月,Anthropic 將MCP開源,率先定義了"模型怎么連接工具和數(shù)據(jù)源"的標(biāo)準(zhǔn)。簡言之,MCP比Claude Code簡單做鏈接更高階,讓模型可自主決定調(diào)用哪些工具,并實(shí)現(xiàn)復(fù)雜任務(wù)。

在生態(tài)能力上,Anthropic 為了解決MCP重復(fù)造輪子的缺點(diǎn),推出了Skills。Skills并沒有創(chuàng)造一個新“功能”,它并不是單純讓Claude去調(diào)用工具,而更像是在給模型裝上記憶與流程。你可以把一整套業(yè)務(wù)流程、模板、甚至公司內(nèi)部知識,打包成一個個Skill模塊,讓 Claude在合適的時機(jī)自動調(diào)用。對開發(fā)者來說,它就像是給LLM加上一層輕量級Workflow,既可控又靈活。不光省token、省時間,還能提升準(zhǔn)確率、方便協(xié)作共建。開發(fā)者借助Skills將編寫的工具與模型對接,給模型擴(kuò)展能力。

當(dāng)智能體可以跨平臺協(xié)作,擁有最豐富工具鏈和操作系統(tǒng)的玩家自然就掌握了立法權(quán)。生態(tài)位的競爭,自然先于技術(shù)路線的分歧。

海外大模型廠商能對B端應(yīng)用有較為成熟的理解,和美國更成熟的SaaS生態(tài)相關(guān)。美國 SaaS 產(chǎn)業(yè)起步于上世紀(jì)80年代,早已形成標(biāo)準(zhǔn)化、成熟的SaaS工作流。因?yàn)閺?qiáng)依賴 標(biāo)準(zhǔn)化API與插件體系,對智能體自動化跨平臺協(xié)作的意愿更強(qiáng)烈。

中國企業(yè)SaaS起步晚近10年,很多企業(yè)業(yè)務(wù)并非高度結(jié)構(gòu)化,這就給國內(nèi)模型廠商的生態(tài)化、標(biāo)準(zhǔn)化工具的推廣帶來阻礙。

好在,覺醒已經(jīng)開始。

今年8月,阿里推出了Qwen Code 嘗試在生態(tài)層面追平,這也讓我們看到了國模在生態(tài)上其實(shí)也頗有前景。

Qwen Code 也表示,將持續(xù)把開發(fā)者體驗(yàn)放在最前面,未來會進(jìn)一步擴(kuò)展 IDE 插件、增強(qiáng)工具調(diào)用能力,持續(xù)靠功能積累提升工程效能。

可以看出Qwen Code 正在慢慢走進(jìn)“AI 工程化”真正的核心戰(zhàn)場,試圖開發(fā)工作流接管,形成自己的規(guī)則。

從長遠(yuǎn)視角看,未來最重要的不是模型的單點(diǎn)性能,而是哪個國家搶到B端標(biāo)準(zhǔn)制定權(quán),雖然參數(shù)提升速度快,追趕成本低;但生態(tài)成熟需要多年開發(fā)者積累、接口標(biāo)準(zhǔn)、企業(yè)垂直理解,這些無法速成。

AI 應(yīng)用生成工具領(lǐng)域的發(fā)展就像基礎(chǔ)模型的競爭一樣,不是一個贏者通吃的市場,而是各家在逐步找到差異化空間,實(shí)現(xiàn)共存,而國模廠商從性價比到生態(tài)也在奮起直追,畢竟我們已經(jīng)意識到,只有建立起自己的生態(tài)與標(biāo)準(zhǔn),中國AI才能真正跨越那道看不見的護(hù)城河。

*題圖由AI生成

       原文標(biāo)題 : AI Coding分水嶺:狂卷參數(shù)的背后,生態(tài)標(biāo)準(zhǔn)之戰(zhàn)才剛開始

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號