无码中文av一区二区三区,日韩人妻不卡一区二区三区,无码粉嫩极极品尤物亚洲

當(dāng)前位置： OFweek 人工智能網(wǎng) > 正文

拆解AI｜“白菜價(jià)”始作俑者、大模型 “價(jià)格屠夫”DeepSeek是誰？

2024-05-23 11:34

藍(lán)鯨

關(guān)注

圖片來源：視覺中國(guó)

在眾多AI應(yīng)用眼花繚亂地涌入市場(chǎng)時(shí)，AI公司深度求索（DeepSeek）上周公告DeepSeekChat已通過北京市生成式人工智能服務(wù)備案，或?qū)⒑芸煜蚬婇_放服務(wù)。

DeepSeek由知名私募巨頭幻方量化于2023年4月創(chuàng)立。與月之暗面、智譜AI、Minimax、百川智能等獲得大廠投資的AI初創(chuàng)公司不同，DeepSeek與科技巨頭間并無直接關(guān)系。但這家公司仍然被視為一匹可能改變國(guó)內(nèi)AI市場(chǎng)格局的“黑馬”。

5月初，DeepSeek宣布開源第二代MoE大模型DeepSeek-V2。據(jù)介紹，該模型在性能上比肩GPT-4 Turbo，價(jià)格卻只有GPT-4的僅百分之一，這也讓DeepSeek收獲了“AI屆拼多多”的名號(hào)。

而直到本周，阿里巴巴和百度才爭(zhēng)先恐后加入大模型價(jià)格戰(zhàn)，DeepSeek的掀桌子舉動(dòng)甚至比智譜AI和字節(jié)跳動(dòng)對(duì)旗下大模型產(chǎn)品的高調(diào)降價(jià)更早。

高性價(jià)比或許是DeepSeek的顯著優(yōu)勢(shì)，但隨著諸多企業(yè)紛紛入局AI價(jià)格戰(zhàn)，已經(jīng)卷出“白菜價(jià)”的大模型很快變得不再稀缺，DeepSeek又該走出怎樣的商業(yè)模式來應(yīng)對(duì)呢？

價(jià)格戰(zhàn)的導(dǎo)火索漸失低價(jià)優(yōu)勢(shì)

DeepSeek-V2推出后，DeepSeek一度被AI圈稱作“價(jià)格屠夫”。

它的中文綜合能力是目前開源模型中最強(qiáng)的，與GPT-4 Turbo，文心4.0等閉源模型處于同一梯隊(duì)。英文綜合能力與最強(qiáng)的開源模型LLaMA3-70B處于同一梯隊(duì)，超過最強(qiáng)MoE開源模型Mixtral8x22B。而這些競(jìng)爭(zhēng)者都背靠科技大廠，或者擁有科技業(yè)界明星團(tuán)隊(duì)。

相較于出色的性能，有分析公司直言DeepSeek-V2的價(jià)格“便宜得難以置信”。該模型每百萬tokens輸入價(jià)格為1元、輸出價(jià)格為2元，而GPT-4 Turbo每百萬tokens的輸入/輸出價(jià)格為72元、217元。

同為中國(guó)公司，盡管DeepSeek率先定下了大模型的低價(jià)，但在過去一周，關(guān)于價(jià)格戰(zhàn)的討論卻更多地圍繞字節(jié)跳動(dòng)、阿里等行業(yè)巨頭。

5月15日，字節(jié)發(fā)布豆包大模型，其主力模型的定價(jià)為輸入0.0008元/千tokens，當(dāng)時(shí)稱較行業(yè)便宜99.3%。阿里云周二宣布，通義千問對(duì)標(biāo)ChatGPT-4的主力模型Qwen-Long，API輸入價(jià)格從0.02元/千tokens降至0.0005元/千tokens，直降97%。百度隨之公告，文心大模型的兩款入門級(jí)主力模型ENIRE Speed、ENIRE Lite全面免費(fèi)。此前，智譜AI入門級(jí)產(chǎn)品GLM-3 Turbo模型的調(diào)用價(jià)格也從5元/百萬tokens降至1元/百萬tokens。

雖然國(guó)外AI公司仍將競(jìng)賽焦點(diǎn)放在技術(shù)的迭代升級(jí)和產(chǎn)品的應(yīng)用場(chǎng)景上，但一些大模型今年也相繼宣布下調(diào)價(jià)格。2月底，法國(guó)人工智能企業(yè)Mistral AI發(fā)布大模型Mistral Large，其輸入、輸出價(jià)格比GPT-4 Turbo便宜約20%，成為OpenAI的強(qiáng)勁對(duì)手。自去年以來，OpenAI已進(jìn)行4次降價(jià)，5月發(fā)布的GPT-4o價(jià)格較前一代模型降低了50%。

降價(jià)有助于大模型快速搶占市場(chǎng)，爭(zhēng)取更多的用戶。而使用量越大，大模型也能被調(diào)用得更好。但并非所有玩家都有資格加入價(jià)格戰(zhàn)，降價(jià)涉及到大模型的研發(fā)、訓(xùn)練、推理等成本的優(yōu)化，一些中小企業(yè)會(huì)難以跟上大廠的腳步。

正如字節(jié)旗下火山引擎總裁譚待所說，“豆包模型的超低定價(jià)，來源于我們有信心用技術(shù)手段優(yōu)化成本，而不是補(bǔ)貼或是打價(jià)格戰(zhàn)爭(zhēng)奪市場(chǎng)份額。”

對(duì)于DeepSeek-V2而言，定出低價(jià)的底氣在于其架構(gòu)的創(chuàng)新。該模型沒有沿用傳統(tǒng)的大模型架構(gòu)，而是采用新的多頭潛在注意力（Multi-Head Latent Attention）和DeepSeekMoE架構(gòu)，在處理信息時(shí)能夠更智能和高效，降低大模型的推理成本。

DeepSeek-V2具有2360億總參數(shù)，但處理每個(gè)token時(shí)只需激活210億參數(shù)。這不僅能夠減少內(nèi)存使用，也能提高計(jì)算效率。一些大模型需要激活所有參數(shù)來提供響應(yīng)，參數(shù)越多，計(jì)算成本也就越高。

AI明星公司Anthropic聯(lián)合創(chuàng)始人、OpenAI前政策主管Jack Clark也關(guān)注到DeepSeek-V2的突破，并表示：“DeepSeek組建了一支團(tuán)隊(duì)，他們對(duì)訓(xùn)練雄心勃勃的模型所需的基礎(chǔ)設(shè)施有著深刻的理解。中國(guó)制造也將成為AI模型的發(fā)展趨勢(shì)。”

此外，也有業(yè)界人士認(rèn)為，DeepSeek可能是中國(guó)幾家大廠之外，擁有英偉達(dá)高性能GPU最多的公司。

隨著頭部廠商們陸續(xù)入局，大模型價(jià)格戰(zhàn)越發(fā)聲勢(shì)浩大，創(chuàng)新能力或可成為DeepSeek參與競(jìng)爭(zhēng)的資本。

不做應(yīng)用做研究

除了開始卷價(jià)格，國(guó)內(nèi)AI行業(yè)還卷起了應(yīng)用的落地。如果說過去一年上演的還是“百模大戰(zhàn)”，2024年則被認(rèn)為將會(huì)是AI應(yīng)用落地元年。

今年3月，月之暗面宣布旗下的Kimi智能助手已支持 200 萬字超長(zhǎng)無損上下文，隨后拉動(dòng)Kimi概念股大漲，反映出市場(chǎng)對(duì)于AI技術(shù)的商業(yè)化應(yīng)用的信心。據(jù)AI產(chǎn)品榜數(shù)據(jù)，4月Kimi訪問量達(dá)2004萬，超過百度文心一言的1691萬。

橫空出世的Kimi搶占風(fēng)口后，巨頭們也開始加速推出一系列AI應(yīng)用。百度聯(lián)合創(chuàng)始人兼首席執(zhí)行官李彥宏多次表態(tài)，“卷大模型沒有意義，卷應(yīng)用機(jī)會(huì)更大。”字節(jié)跳動(dòng)更是一氣推出十多款A(yù)I產(chǎn)品，從“App工廠”轉(zhuǎn)型為“AI應(yīng)用工廠”。大廠們?cè)谕苿?dòng)大模型落地時(shí)大多遵循由內(nèi)到外的邏輯，先基于AI重構(gòu)內(nèi)部產(chǎn)品，再實(shí)現(xiàn)對(duì)外的輸出。

在一片AI應(yīng)用浪潮中，DeepSeek卻顯得有些安靜。其母公司幻方量化的創(chuàng)始人梁文鋒去年在接受媒體采訪時(shí)表示，公司不會(huì)過早地設(shè)計(jì)基于模型的一些應(yīng)用，而是會(huì)專注在大模型上。幻方的目標(biāo)是探索 AGI（人工通用智能），認(rèn)為語言大模型可能是通往AGI的必經(jīng)之路，并且初步具備了AGI的特征，所以會(huì)從大模型開始。

梁文鋒也承認(rèn)，很多風(fēng)投對(duì)于優(yōu)先做研究、不做應(yīng)用的策略有顧慮，希望能盡快實(shí)現(xiàn)產(chǎn)品商業(yè)化，這讓DeepSeek很難獲得融資。但其擁有的算力和工程師團(tuán)隊(duì)相當(dāng)于“有了一半籌碼”。

有云計(jì)算專家提出，1萬枚英偉達(dá)A100芯片是做AI大模型的算力門檻。當(dāng)中國(guó)云廠商受限于緊缺的GPU芯片時(shí)，幻方卻早早押中了大模型賽道的入場(chǎng)券。據(jù)報(bào)道，除商湯科技、百度、騰訊、字節(jié)、阿里等科技巨頭外，幻方也手握著超1萬枚GPU。

梁文鋒在媒體采訪中表示，幻方對(duì)算力的儲(chǔ)備并不突然。在2019年，幻方就已投資2億元自研深度學(xué)習(xí)訓(xùn)練平臺(tái)“螢火一號(hào)”，搭載了1100塊GPU。到了2021年，“螢火二號(hào)”的投入增加到10億元，搭載了約1萬張英偉達(dá)A100顯卡。一年后，OpenAI發(fā)布ChatGPT的公開測(cè)試版本，拉開全球新一輪AI熱潮的序幕。

頂著高昂的研發(fā)成本，百度、阿里等頭部玩家已開始大打價(jià)格戰(zhàn)，搶占市場(chǎng)，期望有更多的真實(shí)使用場(chǎng)景以推進(jìn)產(chǎn)品訓(xùn)練。而事實(shí)上率先掀起本輪大模型價(jià)格戰(zhàn)，喊著“不做應(yīng)用做研究”的DeepSeek，卻并沒有在各家大廠密集召開降價(jià)發(fā)布會(huì)時(shí)發(fā)聲，顯得無心參戰(zhàn)。盡管背后有幻方量化提供研發(fā)經(jīng)費(fèi)，DeepSeek不計(jì)ROI的堅(jiān)持究竟會(huì)導(dǎo)向領(lǐng)先，還是落后的未來呢？

原文標(biāo)題 : 拆解AI｜“白菜價(jià)”始作俑者、大模型 “價(jià)格屠夫”DeepSeek是誰？