拆解AI|“白菜價(jià)”始作俑者、大模型 “價(jià)格屠夫”DeepSeek是誰?
圖片來源:視覺中國(guó)
在眾多AI應(yīng)用眼花繚亂地涌入市場(chǎng)時(shí),AI公司深度求索(DeepSeek)上周公告DeepSeekChat已通過北京市生成式人工智能服務(wù)備案,或?qū)⒑芸煜蚬婇_放服務(wù)。
DeepSeek由知名私募巨頭幻方量化于2023年4月創(chuàng)立。與月之暗面、智譜AI、Minimax、百川智能等獲得大廠投資的AI初創(chuàng)公司不同,DeepSeek與科技巨頭間并無直接關(guān)系。但這家公司仍然被視為一匹可能改變國(guó)內(nèi)AI市場(chǎng)格局的“黑馬”。
5月初,DeepSeek宣布開源第二代MoE大模型DeepSeek-V2。據(jù)介紹,該模型在性能上比肩GPT-4 Turbo,價(jià)格卻只有GPT-4的僅百分之一,這也讓DeepSeek收獲了“AI屆拼多多”的名號(hào)。
而直到本周,阿里巴巴和百度才爭(zhēng)先恐后加入大模型價(jià)格戰(zhàn),DeepSeek的掀桌子舉動(dòng)甚至比智譜AI和字節(jié)跳動(dòng)對(duì)旗下大模型產(chǎn)品的高調(diào)降價(jià)更早。
高性價(jià)比或許是DeepSeek的顯著優(yōu)勢(shì),但隨著諸多企業(yè)紛紛入局AI價(jià)格戰(zhàn),已經(jīng)卷出“白菜價(jià)”的大模型很快變得不再稀缺,DeepSeek又該走出怎樣的商業(yè)模式來應(yīng)對(duì)呢?
價(jià)格戰(zhàn)的導(dǎo)火索漸失低價(jià)優(yōu)勢(shì)
DeepSeek-V2推出后,DeepSeek一度被AI圈稱作“價(jià)格屠夫”。
它的中文綜合能力是目前開源模型中最強(qiáng)的,與GPT-4 Turbo,文心4.0等閉源模型處于同一梯隊(duì)。英文綜合能力與最強(qiáng)的開源模型LLaMA3-70B處于同一梯隊(duì),超過最強(qiáng)MoE開源模型Mixtral8x22B。而這些競(jìng)爭(zhēng)者都背靠科技大廠,或者擁有科技業(yè)界明星團(tuán)隊(duì)。
相較于出色的性能,有分析公司直言DeepSeek-V2的價(jià)格“便宜得難以置信”。該模型每百萬tokens輸入價(jià)格為1元、輸出價(jià)格為2元,而GPT-4 Turbo每百萬tokens的輸入/輸出價(jià)格為72元、217元。
同為中國(guó)公司,盡管DeepSeek率先定下了大模型的低價(jià),但在過去一周,關(guān)于價(jià)格戰(zhàn)的討論卻更多地圍繞字節(jié)跳動(dòng)、阿里等行業(yè)巨頭。
5月15日,字節(jié)發(fā)布豆包大模型,其主力模型的定價(jià)為輸入0.0008元/千tokens,當(dāng)時(shí)稱較行業(yè)便宜99.3%。阿里云周二宣布,通義千問對(duì)標(biāo)ChatGPT-4的主力模型Qwen-Long,API輸入價(jià)格從0.02元/千tokens降至0.0005元/千tokens,直降97%。百度隨之公告,文心大模型的兩款入門級(jí)主力模型ENIRE Speed、ENIRE Lite全面免費(fèi)。此前,智譜AI入門級(jí)產(chǎn)品GLM-3 Turbo模型的調(diào)用價(jià)格也從5元/百萬tokens降至1元/百萬tokens。
雖然國(guó)外AI公司仍將競(jìng)賽焦點(diǎn)放在技術(shù)的迭代升級(jí)和產(chǎn)品的應(yīng)用場(chǎng)景上,但一些大模型今年也相繼宣布下調(diào)價(jià)格。2月底,法國(guó)人工智能企業(yè)Mistral AI發(fā)布大模型Mistral Large,其輸入、輸出價(jià)格比GPT-4 Turbo便宜約20%,成為OpenAI的強(qiáng)勁對(duì)手。自去年以來,OpenAI已進(jìn)行4次降價(jià),5月發(fā)布的GPT-4o價(jià)格較前一代模型降低了50%。
降價(jià)有助于大模型快速搶占市場(chǎng),爭(zhēng)取更多的用戶。而使用量越大,大模型也能被調(diào)用得更好。但并非所有玩家都有資格加入價(jià)格戰(zhàn),降價(jià)涉及到大模型的研發(fā)、訓(xùn)練、推理等成本的優(yōu)化,一些中小企業(yè)會(huì)難以跟上大廠的腳步。
正如字節(jié)旗下火山引擎總裁譚待所說,“豆包模型的超低定價(jià),來源于我們有信心用技術(shù)手段優(yōu)化成本,而不是補(bǔ)貼或是打價(jià)格戰(zhàn)爭(zhēng)奪市場(chǎng)份額。”
對(duì)于DeepSeek-V2而言,定出低價(jià)的底氣在于其架構(gòu)的創(chuàng)新。該模型沒有沿用傳統(tǒng)的大模型架構(gòu),而是采用新的多頭潛在注意力(Multi-Head Latent Attention)和DeepSeekMoE架構(gòu),在處理信息時(shí)能夠更智能和高效,降低大模型的推理成本。
DeepSeek-V2具有2360億總參數(shù),但處理每個(gè)token時(shí)只需激活210億參數(shù)。這不僅能夠減少內(nèi)存使用,也能提高計(jì)算效率。一些大模型需要激活所有參數(shù)來提供響應(yīng),參數(shù)越多,計(jì)算成本也就越高。
AI明星公司Anthropic聯(lián)合創(chuàng)始人、OpenAI前政策主管Jack Clark也關(guān)注到DeepSeek-V2的突破,并表示:“DeepSeek組建了一支團(tuán)隊(duì),他們對(duì)訓(xùn)練雄心勃勃的模型所需的基礎(chǔ)設(shè)施有著深刻的理解。中國(guó)制造也將成為AI模型的發(fā)展趨勢(shì)。”
此外,也有業(yè)界人士認(rèn)為,DeepSeek可能是中國(guó)幾家大廠之外,擁有英偉達(dá)高性能GPU最多的公司。
隨著頭部廠商們陸續(xù)入局,大模型價(jià)格戰(zhàn)越發(fā)聲勢(shì)浩大,創(chuàng)新能力或可成為DeepSeek參與競(jìng)爭(zhēng)的資本。
不做應(yīng)用做研究
除了開始卷價(jià)格,國(guó)內(nèi)AI行業(yè)還卷起了應(yīng)用的落地。如果說過去一年上演的還是“百模大戰(zhàn)”,2024年則被認(rèn)為將會(huì)是AI應(yīng)用落地元年。
今年3月,月之暗面宣布旗下的Kimi智能助手已支持 200 萬字超長(zhǎng)無損上下文,隨后拉動(dòng)Kimi概念股大漲,反映出市場(chǎng)對(duì)于AI技術(shù)的商業(yè)化應(yīng)用的信心。據(jù)AI產(chǎn)品榜數(shù)據(jù),4月Kimi訪問量達(dá)2004萬,超過百度文心一言的1691萬。
橫空出世的Kimi搶占風(fēng)口后,巨頭們也開始加速推出一系列AI應(yīng)用。百度聯(lián)合創(chuàng)始人兼首席執(zhí)行官李彥宏多次表態(tài),“卷大模型沒有意義,卷應(yīng)用機(jī)會(huì)更大。”字節(jié)跳動(dòng)更是一氣推出十多款A(yù)I產(chǎn)品,從“App工廠”轉(zhuǎn)型為“AI應(yīng)用工廠”。大廠們?cè)谕苿?dòng)大模型落地時(shí)大多遵循由內(nèi)到外的邏輯,先基于AI重構(gòu)內(nèi)部產(chǎn)品,再實(shí)現(xiàn)對(duì)外的輸出。
在一片AI應(yīng)用浪潮中,DeepSeek卻顯得有些安靜。其母公司幻方量化的創(chuàng)始人梁文鋒去年在接受媒體采訪時(shí)表示,公司不會(huì)過早地設(shè)計(jì)基于模型的一些應(yīng)用,而是會(huì)專注在大模型上。幻方的目標(biāo)是探索 AGI(人工通用智能),認(rèn)為語言大模型可能是通往AGI的必經(jīng)之路,并且初步具備了AGI的特征,所以會(huì)從大模型開始。
梁文鋒也承認(rèn),很多風(fēng)投對(duì)于優(yōu)先做研究、不做應(yīng)用的策略有顧慮,希望能盡快實(shí)現(xiàn)產(chǎn)品商業(yè)化,這讓DeepSeek很難獲得融資。但其擁有的算力和工程師團(tuán)隊(duì)相當(dāng)于“有了一半籌碼”。
有云計(jì)算專家提出,1萬枚英偉達(dá)A100芯片是做AI大模型的算力門檻。當(dāng)中國(guó)云廠商受限于緊缺的GPU芯片時(shí),幻方卻早早押中了大模型賽道的入場(chǎng)券。據(jù)報(bào)道,除商湯科技、百度、騰訊、字節(jié)、阿里等科技巨頭外,幻方也手握著超1萬枚GPU。
梁文鋒在媒體采訪中表示,幻方對(duì)算力的儲(chǔ)備并不突然。在2019年,幻方就已投資2億元自研深度學(xué)習(xí)訓(xùn)練平臺(tái)“螢火一號(hào)”,搭載了1100塊GPU。到了2021年,“螢火二號(hào)”的投入增加到10億元,搭載了約1萬張英偉達(dá)A100顯卡。一年后,OpenAI發(fā)布ChatGPT的公開測(cè)試版本,拉開全球新一輪AI熱潮的序幕。
頂著高昂的研發(fā)成本,百度、阿里等頭部玩家已開始大打價(jià)格戰(zhàn),搶占市場(chǎng),期望有更多的真實(shí)使用場(chǎng)景以推進(jìn)產(chǎn)品訓(xùn)練。而事實(shí)上率先掀起本輪大模型價(jià)格戰(zhàn),喊著“不做應(yīng)用做研究”的DeepSeek,卻并沒有在各家大廠密集召開降價(jià)發(fā)布會(huì)時(shí)發(fā)聲,顯得無心參戰(zhàn)。盡管背后有幻方量化提供研發(fā)經(jīng)費(fèi),DeepSeek不計(jì)ROI的堅(jiān)持究竟會(huì)導(dǎo)向領(lǐng)先,還是落后的未來呢?
原文標(biāo)題 : 拆解AI|“白菜價(jià)”始作俑者、大模型 “價(jià)格屠夫”DeepSeek是誰?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?