訂閱
糾錯
加入自媒體

落選“果鏈”,別再捧殺DeepSeek了

2025-02-13 17:44
鋅刻度
關注

圖片

是對手也是隊友

撰文陳鄧新

編輯/ 李覲麟

排版/ Annalee

DeepSeek,持續(xù)正反饋AI賽道。

2025年2月13日,文心一言宣布將于4月1日0時起全面免費,所有PC端和APP端用戶均可體驗文心系列最新模型,而此前只有免費使用3.5版。

隨之而來的,則是輿論此起彼伏。

在蘋果不選擇DeepSeek作為“AI搭子”時,The Information報道,蘋果考慮了多個國內(nèi)的對象,與阿里巴巴的合作已取得重大進展,并明確拒絕了DeepSeek。

這意味著,DeepSeek落選了蘋果供應鏈,令人唏噓不已。

其實,BAT們與DeepSeek并非“針尖對麥芒”。

文小言、騰訊元寶等接入DeepSeek大模型,為用戶提供更多的AI選擇;阿里云、騰訊云、華為云、京東云、火山引擎、百度智能云等主流云服務平臺紛紛上線DeepSeek大模型,鼓勵用戶嘗鮮DeepSeek-R1、DeepSeek-V3……

BAT們與DeepSeek,是對手也是隊友?

沒有拔刀相向,反而雪中送炭

DeepSeek的初衷,是印證“條條大路通羅馬”。

生成式AI革命爆發(fā)之后,大模型站上了“風口”,而算力成為衡量大模型能力的核心指標之一,在力大飛磚的簡單思維之下,硅谷將算力塑造為“皇冠上的明珠”,被視為難以企及的力量。

于是乎,算力緊張成為行業(yè)的關鍵詞,令AI成本長期居高不下。

此背景下,DeepSeek通過算法優(yōu)化等手段降低了AI成本,用最少的資源達到最大的效果,為行業(yè)花小錢辦大事提供了新的思路和方向。

 

圖片

圖源:DeepSeek官網(wǎng)

這意味著,擴大算力并非AI進化的唯一途徑。

斯坦福大學人工智能實驗室主任吳恩達:“近年來,圍繞‘擴大模型規(guī)模能夠推動AI進步’的觀點備受追捧。事實上,我曾是這一理念的早期支持者。”

不難看出,消解算力壁壘才是DeepSeek的真正影響。

巧的是,這也是全球互聯(lián)網(wǎng)巨頭共同的夙愿:唯有不斷降低成本,AI普惠才可以從夢想照進現(xiàn)實,從而顛覆傳統(tǒng)的產(chǎn)業(yè)格局與商業(yè)模式。

更為重要的是,可以錯位競爭。

DeepSeek創(chuàng)始人梁文鋒表示:“長遠來說,我們希望形成一種生態(tài),就是業(yè)界直接使用我們的技術和產(chǎn)出,我們只負責基礎模型和前沿的創(chuàng)新,然后其他公司在DeepSeek 的基礎上構建To B、To C的業(yè)務。”

關于此,從BAT們的態(tài)度就可見一斑。

QuestMobile的數(shù)據(jù)顯示,DeepSeek的日活躍用戶數(shù)已突破3000萬大關,創(chuàng)造了史上最快達成這一成就的新紀錄。

隨之而來的則是,“服務器繁忙,請稍后再試”屢屢被用戶詬病。

 

圖片

屢屢被用戶詬病

騰訊云、阿里云、京東云、華為云、火山引擎、百度智能云等紛紛伸出援手,滿足外界對DeepSeek不斷增長的推理需求。

譬如,京東云上線DeepSeek-R1和DeepSeek-V3模型,支持公有云在線部署、專混私有化實例部署兩種模式。

再譬如,騰訊云支持開發(fā)者將“滿血版”DeepSeek 接入微信小程序,可實現(xiàn)智能對話、文本生成等功能。

天使投資人、資深人工智能專家郭濤認為DeepSeek不會沖擊行業(yè)原有的競爭格局:“文心一言、通義千問等AI大模型都已建立起完善的生態(tài)體系,且背后有百度、阿里巴巴等強大企業(yè)的支持,技術實力雄厚,能夠持續(xù)投入研發(fā)進行技術迭代升級。”

AI創(chuàng)新是一場馬拉松而非短跑

以上可見,BAT們對DeepSeek的態(tài)度頗為友好,這背后的緣由有三。

首先,降本一直進行中。

DeepSeek之前,BAT們就在不斷推動AI降低成本,也取得非常不錯的成就,共同推動大模型定價進入“厘時代”。

事實上,BAT們的創(chuàng)新也可圈可點。

 譬如,字節(jié)跳動設計了一個全新的稀疏模型架構UltraMem,有效解決了傳統(tǒng)主流MoE架構存在的推理時高額訪存問題,從而提升推理速度2倍至6倍,推理成本最高可降低83%。

 上述架構創(chuàng)新,與DeepSeek有異曲同工之妙。

再譬如,百度點亮國內(nèi)首個自研萬卡集群,有效解決了過去算力價格高以及無法穩(wěn)定應用的問題,通過集群效能最大化達到降低單位算力成本的目的。

“今天,創(chuàng)新速度比以往都快得多。摩爾定律中,每18個月,性能就會翻倍,價格減半;如今,大模型推理成本每年能降低90%以上。”李彥宏稱。

 

圖片

圖源:AI產(chǎn)品榜

其次,模型蒸餾成為競爭新高地。

模型蒸餾成為獲取低成本AI的重要路徑,進一步降低了大模型的門檻,為AI落地走進千家萬戶提供了更多的可能。

李飛飛團隊訓練出的s1人工智能推理模型,就是其中的代表。

 s1人工智能推理模型以阿里巴巴通義千問為基座模型進行微調(diào),蒸餾了谷歌推理模型Gemini 2.0 Flash Thinking Experimental的1000個樣本,在數(shù)學和編碼能力測試中的表現(xiàn)與OpenAI的o1和DeepSeek的R1等尖端推理模型類似,耗費不到50美元。

換而言之,模型蒸餾為行業(yè)指明一個新的前進方向。

德邦證券的研究表明,2025年將是模型蒸餾技術的爆發(fā)年,AI應用的成本有望大幅下降,模型能力也將全面提升;通過引導和支持,AI模型不僅能夠在云端獲取巨大的優(yōu)勢,也能在邊緣計算等端側(cè)應用中發(fā)揮重要作用。

如此一來,BAT們有了更大的發(fā)力空間,沒有與DeepSeek較勁的必要。

中國首席經(jīng)濟學家論壇理事劉煜輝表示:“現(xiàn)實世界可以用來訓練AI模型的數(shù)據(jù)資料已經(jīng)耗盡,現(xiàn)在大家都是相互借鑒數(shù)據(jù)相互蒸餾,大家的模型水平根本拉不開差距,拼的就是誰能夠找到新的應用場景、誰能率先把價格打下來。”

再次,不排除結下善緣的可能。

種種跡象表明,DeepSeek雖然初期拒絕了融資,但隨著規(guī)模不斷擴大,資源瓶頸問題肉眼可見,成為一個棘手的問題。

一名私募人士告訴鋅刻度:“DeepSeek背靠的幻方量化雖然是千億元體量,但客戶的錢不等于幻方的錢,更不等于可以投入的錢,遲早需要尋找外援。”

實際上,量化并不能長時間“躺贏”。

幻方量化CEO陸政哲曾坦言:“迅速崛起、規(guī)?焖俜糯、又飛快衰落消失,這仿佛是量化行業(yè)的死循環(huán),像懸在我們頭上的達摩克利斯之劍。”

從這個角度來看,BAT們可以在算力、數(shù)據(jù)、場景等全方位助力DeepSeek,大家各取所需實現(xiàn)雙贏。

實際上,BAT們一直青睞富有特色的AI初創(chuàng)企業(yè),被譽為“AI六小龍”的智譜AI、月之暗面、百川智能、零一萬物、階躍星辰、MiniMax,背后不乏騰訊、小米、美團、阿里巴巴等身影。

總而言之,AI創(chuàng)新是一場馬拉松而非短跑,比拼的是耐力與毅力,無論BAT們這樣的頭部選手,還是DeepSeek這樣的初創(chuàng)企業(yè),都有彎道超車的機會,相互借力與借鑒才可以共同提高,大家都有美好的未來。

那么,神話DeepSeek大可不必。

       原文標題 : 落選“果鏈”,別再捧殺DeepSeek了

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號