訂閱
糾錯
加入自媒體

DeepSeek的“鯰魚效應(yīng)”

圖片

【潮汐商業(yè)評論原創(chuàng)】

蛇年前夕,DeepSeek猶如一顆“原子彈”般震撼了全球人工智能領(lǐng)域。

這款主打“極致性價比”的大語言模型,不僅在性能上比肩OpenAI的頂尖模型o1,其成本更是僅為GPT-4o的十分之一,API調(diào)用成本更是低至OpenAI的三十分之一。

這證明了AI企業(yè)依靠燒錢卷“投流”“獲客”的路徑不可行,更凸顯了長期主義地原始創(chuàng)新和低成本研發(fā)的重要性。

這也打破了技術(shù)閉源的OpenAI和英偉達的市場壟斷,更引發(fā)了全球科技巨頭的股價波動,英偉達市值一夜之間蒸發(fā)4.3萬億元。

目前,DeepSeek累計用戶已經(jīng)超過了1.25億。它像鯰魚一樣,攪動全球人工智能領(lǐng)域,讓國內(nèi)AI基建重拾信心,被稱為“國運”級別的存在。

01 新路徑彎道搶跑

AI大模型是一個重資產(chǎn)行業(yè),2024年Scaling Law仍未失效,隨著模型不斷變大,訓(xùn)練新模型需要更多的數(shù)據(jù)、更多的算力。

這意味著需要充足的資金支撐。一位大廠高層給出判斷,做大模型,“一年低消也要20億-30億美元”。

DeepSeek的出現(xiàn),證明了AI企業(yè)依靠燒錢卷“投流”“獲客”的路徑是不可行的,以往中國AI大模型“卷”算力、“卷”價格、“卷”獲客、“卷”變現(xiàn)能力,如今人們更認可長期主義的原始創(chuàng)新,企業(yè)應(yīng)當思考架構(gòu)創(chuàng)新和低成本研發(fā),而不是一味燒錢。

圖片

在過去的2024年,月之暗面的Kimi和字節(jié)跳動的豆包輪番成為大眾追捧的AI應(yīng)用。它們背后是重金推廣和瘋狂卷算力。

以抖音為例,2024年字節(jié)跳動才開始在大模型上發(fā)力,憑借此前的火山云基礎(chǔ)設(shè)施和人才團隊積累,以及大規(guī)模資金投入和四處挖人。在互聯(lián)網(wǎng)四巨頭里,字節(jié)跳動在AI領(lǐng)域的投入上高達800億人民幣,遠超騰訊、阿里、百度。

字節(jié)跳動旗下火山引擎支持多芯、多云架構(gòu),擁有超大規(guī)模算力,支持萬卡集群組網(wǎng)、萬億參數(shù)MoE大模型;提供超高性能網(wǎng)絡(luò),支持3.2TbpsRDMA網(wǎng)絡(luò),全球網(wǎng)絡(luò)POP覆蓋廣,時延優(yōu)化最高達75%,在算力資源上優(yōu)勢也很明顯。

DeepSeek的出現(xiàn)推動了AI技術(shù)更加普及和高效,其崛起將推動小型化模型即邊緣AI的推廣,使云端和邊緣處理的混合AI模型被認為是AI未來的發(fā)展方向。

02 與友商們都“交個朋友”

DeepSeek解決了國產(chǎn)AI領(lǐng)域的困局,應(yīng)用的落地,激活了整個行業(yè)。國產(chǎn)芯片、軟硬件公司、云廠商紛紛接入DeepSeek“交個朋友”。

大模型企業(yè)們對于算力的需求不斷攀升,對于云服務(wù)的需求提升明顯。騰訊云、阿里云、華為云、百度智能云、火山引擎等數(shù)十家云計算服務(wù)龍頭,拆掉了圍墻,都推出限時優(yōu)惠、包年包月等選項。

在芯片領(lǐng)域,華為昇騰、沐曦科技、摩爾線程、壁仞科技等10多家國產(chǎn)AI芯片企業(yè),都表示適配了DeepSeek原版或“蒸餾”后的小尺寸版本。

同時,國產(chǎn)手機品牌和新能源汽車品牌也紛紛接入DeepSeek。

圖片

另外,DeepSeek也刺激了阿里云通義團隊發(fā)布旗艦?zāi)P?ldquo;Qwen2.5-Max”,成為第二家可以比肩美國OpenAI公司o1系列的國產(chǎn)大語言模型,讓行業(yè)內(nèi)外為之振奮。

DeepSeek的效應(yīng)還在持續(xù),將吸引以華為為代表(還包括寒武紀、海光、摩爾線程等)的國產(chǎn)算力廠商會投入更大資源支持國產(chǎn)大模型的適配,政府資源的支持力度也會加大,這有利于國內(nèi)人工智能的產(chǎn)業(yè)鏈更好發(fā)展。

同時也會加劇競爭,頭部優(yōu)勢廠商變強,一批原先瞄準通用大模型為目標的創(chuàng)業(yè)公司和互聯(lián)網(wǎng)公司將因為資源無法支撐而退出角逐,轉(zhuǎn)而做特定方向的人工智能應(yīng)用落地,這有助于我們國內(nèi)人工智能產(chǎn)業(yè)資源的更合理分布。

DeepSeek驗證的長思維鏈模式,有助于整個產(chǎn)業(yè)鏈降低在數(shù)據(jù)推理路徑標注的投入,未來大模型在需要復(fù)雜推理的應(yīng)用落地過程會進一步加快。

從DeepSeek的推出到應(yīng)用端鋪開布局,再到投資者重新理解中國科技企業(yè)的技術(shù)潛力、對科技股價值重估,這種轉(zhuǎn)換讓人炫目。DeepSeek“國運”系身一點都不夸張。

03 國產(chǎn)大模型有了新奔頭

DeepSeek的爆火出圈,也讓美國和歐洲看到,中國在大模型產(chǎn)業(yè)已經(jīng)形成一批頗具實力和影響力的公司,其中有字節(jié)跳動、阿里、騰訊等大廠身影,也有月之暗面、智譜、MiniMax等初創(chuàng)企業(yè)。

客觀來講,國內(nèi)無論是DeepSeek V3/R1、訊飛星火X1,還是字節(jié)的豆包、阿里的通義千問等國產(chǎn)大模型,目前和OpenAI的o3相比在現(xiàn)實物理規(guī)律的理解和運用、超復(fù)雜科學問題的求解、多模態(tài)視頻流輸入理解等高難度任務(wù)上還是有差距。

圖片

通用人工智能也不僅局限于此,在多模態(tài)大模型、具身智能、世界模型、環(huán)境模擬器等多個方面,中國的人工智能都有可挖掘的巨大空間,尤其是在高制程人工智能芯片的量產(chǎn)和演進能力方面。

當然,中國人工智能還是會面臨一些挑戰(zhàn)。

DeepSeek基于以英偉達算力取得的如此大的成就,勢必會引發(fā)海外針對芯片供應(yīng)的封鎖手段不斷升級,給國產(chǎn)大模型的發(fā)展帶來更多限制。

尤其是美國大概率會對我國的英偉達算力獲取和國產(chǎn)算力海外投片采取更嚴苛的限制措施,H800、A100、H20等卡將會被全面禁止,給DeepSeek帶來的限制將日益增多。

所以實現(xiàn)國產(chǎn)算力的自主可控將更為關(guān)鍵。幸運的是,國產(chǎn)所有大模型中已經(jīng)有一家公司憑借國產(chǎn)算力做出了成績。

訊飛星火大模型的訓(xùn)練和推理都在國產(chǎn)算力上進行的,并且僅用了1萬張910B國產(chǎn)算力卡。科大訊飛不僅用比友商少數(shù)倍的算力取得了大模型研發(fā)上的一些成果,而且還做了大量國產(chǎn)算力平臺上的無人區(qū)的適配和效率優(yōu)化,可以說是真正把國產(chǎn)算力做到了極致效率,這比在英偉達上的實現(xiàn)更需要技術(shù)實力和勇氣,也更具有戰(zhàn)略意義。

圖片

如果訊飛星火能取得成功,將會像DeepSeek一樣,給予了我國同行們比以往更有信心和勇氣做底層的技術(shù)創(chuàng)新。

從這個角度上看,DeepSeek也只是為2025年中國人工智能拉開了大幕,真正的爆發(fā)正在迎面趕來。

潮汐編輯部的Jesse最近兩周已經(jīng)習慣了在成稿后來一場“人機對話”,以期獲得些意外的觀點。這次當她把問題輸入,只見對話框旋轉(zhuǎn)半天后,DeepSeek彈出了一行字:“服務(wù)器繁忙,請稍后再試。”

DeepSeek以“白菜價”技術(shù)打破壟斷,用開源生態(tài)凝聚產(chǎn)業(yè)鏈,最終引爆了國內(nèi)AI從技術(shù)到商業(yè)的全面升級。可這一切都來的太快了,烈火烹油,總要給Deepseek和整個AI行業(yè)一點時間適應(yīng)。

正如DeepSeek創(chuàng)始人梁文鋒在采訪中所說,“以后硬核創(chuàng)新會越來越多。當這個社會讓硬核創(chuàng)新的人功成名就,群體性想法就會改變。我們只是還需要一堆事實和一個過程。”

你看,商業(yè)就是這樣。

       原文標題 : DeepSeek的“鯰魚效應(yīng)”

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號