落選“果鏈”,別再捧殺DeepSeek了
是對手也是隊友
撰文/ 陳鄧新
編輯/ 李覲麟
排版/ Annalee
DeepSeek,持續(xù)正反饋AI賽道。
2025年2月13日,文心一言宣布將于4月1日0時起全面免費,所有PC端和APP端用戶均可體驗文心系列最新模型,而此前只有免費使用3.5版。
隨之而來的,則是輿論此起彼伏。
在蘋果不選擇DeepSeek作為“AI搭子”時,The Information報道,蘋果考慮了多個國內(nèi)的對象,與阿里巴巴的合作已取得重大進展,并明確拒絕了DeepSeek。
這意味著,DeepSeek落選了蘋果供應鏈,令人唏噓不已。
其實,BAT們與DeepSeek并非“針尖對麥芒”。
文小言、騰訊元寶等接入DeepSeek大模型,為用戶提供更多的AI選擇;阿里云、騰訊云、華為云、京東云、火山引擎、百度智能云等主流云服務平臺紛紛上線DeepSeek大模型,鼓勵用戶嘗鮮DeepSeek-R1、DeepSeek-V3……
BAT們與DeepSeek,是對手也是隊友?
沒有拔刀相向,反而雪中送炭
DeepSeek的初衷,是印證“條條大路通羅馬”。
生成式AI革命爆發(fā)之后,大模型站上了“風口”,而算力成為衡量大模型能力的核心指標之一,在力大飛磚的簡單思維之下,硅谷將算力塑造為“皇冠上的明珠”,被視為難以企及的力量。
于是乎,算力緊張成為行業(yè)的關鍵詞,令AI成本長期居高不下。
此背景下,DeepSeek通過算法優(yōu)化等手段降低了AI成本,用最少的資源達到最大的效果,為行業(yè)花小錢辦大事提供了新的思路和方向。
圖源:DeepSeek官網(wǎng)
這意味著,擴大算力并非AI進化的唯一途徑。
斯坦福大學人工智能實驗室主任吳恩達:“近年來,圍繞‘擴大模型規(guī)模能夠推動AI進步’的觀點備受追捧。事實上,我曾是這一理念的早期支持者。”
不難看出,消解算力壁壘才是DeepSeek的真正影響。
巧的是,這也是全球互聯(lián)網(wǎng)巨頭共同的夙愿:唯有不斷降低成本,AI普惠才可以從夢想照進現(xiàn)實,從而顛覆傳統(tǒng)的產(chǎn)業(yè)格局與商業(yè)模式。
更為重要的是,可以錯位競爭。
DeepSeek創(chuàng)始人梁文鋒表示:“長遠來說,我們希望形成一種生態(tài),就是業(yè)界直接使用我們的技術和產(chǎn)出,我們只負責基礎模型和前沿的創(chuàng)新,然后其他公司在DeepSeek 的基礎上構建To B、To C的業(yè)務。”
關于此,從BAT們的態(tài)度就可見一斑。
QuestMobile的數(shù)據(jù)顯示,DeepSeek的日活躍用戶數(shù)已突破3000萬大關,創(chuàng)造了史上最快達成這一成就的新紀錄。
隨之而來的則是,“服務器繁忙,請稍后再試”屢屢被用戶詬病。
屢屢被用戶詬病
騰訊云、阿里云、京東云、華為云、火山引擎、百度智能云等紛紛伸出援手,滿足外界對DeepSeek不斷增長的推理需求。
譬如,京東云上線DeepSeek-R1和DeepSeek-V3模型,支持公有云在線部署、專混私有化實例部署兩種模式。
再譬如,騰訊云支持開發(fā)者將“滿血版”DeepSeek 接入微信小程序,可實現(xiàn)智能對話、文本生成等功能。
天使投資人、資深人工智能專家郭濤認為DeepSeek不會沖擊行業(yè)原有的競爭格局:“文心一言、通義千問等AI大模型都已建立起完善的生態(tài)體系,且背后有百度、阿里巴巴等強大企業(yè)的支持,技術實力雄厚,能夠持續(xù)投入研發(fā)進行技術迭代升級。”
AI創(chuàng)新是一場馬拉松而非短跑
以上可見,BAT們對DeepSeek的態(tài)度頗為友好,這背后的緣由有三。
首先,降本一直進行中。
DeepSeek之前,BAT們就在不斷推動AI降低成本,也取得非常不錯的成就,共同推動大模型定價進入“厘時代”。
事實上,BAT們的創(chuàng)新也可圈可點。
譬如,字節(jié)跳動設計了一個全新的稀疏模型架構UltraMem,有效解決了傳統(tǒng)主流MoE架構存在的推理時高額訪存問題,從而提升推理速度2倍至6倍,推理成本最高可降低83%。
上述架構創(chuàng)新,與DeepSeek有異曲同工之妙。
再譬如,百度點亮國內(nèi)首個自研萬卡集群,有效解決了過去算力價格高以及無法穩(wěn)定應用的問題,通過集群效能最大化達到降低單位算力成本的目的。
“今天,創(chuàng)新速度比以往都快得多。摩爾定律中,每18個月,性能就會翻倍,價格減半;如今,大模型推理成本每年能降低90%以上。”李彥宏稱。
圖源:AI產(chǎn)品榜
其次,模型蒸餾成為競爭新高地。
模型蒸餾成為獲取低成本AI的重要路徑,進一步降低了大模型的門檻,為AI落地走進千家萬戶提供了更多的可能。
李飛飛團隊訓練出的s1人工智能推理模型,就是其中的代表。
s1人工智能推理模型以阿里巴巴通義千問為基座模型進行微調(diào),蒸餾了谷歌推理模型Gemini 2.0 Flash Thinking Experimental的1000個樣本,在數(shù)學和編碼能力測試中的表現(xiàn)與OpenAI的o1和DeepSeek的R1等尖端推理模型類似,耗費不到50美元。
換而言之,模型蒸餾為行業(yè)指明一個新的前進方向。
德邦證券的研究表明,2025年將是模型蒸餾技術的爆發(fā)年,AI應用的成本有望大幅下降,模型能力也將全面提升;通過引導和支持,AI模型不僅能夠在云端獲取巨大的優(yōu)勢,也能在邊緣計算等端側(cè)應用中發(fā)揮重要作用。
如此一來,BAT們有了更大的發(fā)力空間,沒有與DeepSeek較勁的必要。
中國首席經(jīng)濟學家論壇理事劉煜輝表示:“現(xiàn)實世界可以用來訓練AI模型的數(shù)據(jù)資料已經(jīng)耗盡,現(xiàn)在大家都是相互借鑒數(shù)據(jù)相互蒸餾,大家的模型水平根本拉不開差距,拼的就是誰能夠找到新的應用場景、誰能率先把價格打下來。”
再次,不排除結下善緣的可能。
種種跡象表明,DeepSeek雖然初期拒絕了融資,但隨著規(guī)模不斷擴大,資源瓶頸問題肉眼可見,成為一個棘手的問題。
一名私募人士告訴鋅刻度:“DeepSeek背靠的幻方量化雖然是千億元體量,但客戶的錢不等于幻方的錢,更不等于可以投入的錢,遲早需要尋找外援。”
實際上,量化并不能長時間“躺贏”。
幻方量化CEO陸政哲曾坦言:“迅速崛起、規(guī)?焖俜糯、又飛快衰落消失,這仿佛是量化行業(yè)的死循環(huán),像懸在我們頭上的達摩克利斯之劍。”
從這個角度來看,BAT們可以在算力、數(shù)據(jù)、場景等全方位助力DeepSeek,大家各取所需實現(xiàn)雙贏。
實際上,BAT們一直青睞富有特色的AI初創(chuàng)企業(yè),被譽為“AI六小龍”的智譜AI、月之暗面、百川智能、零一萬物、階躍星辰、MiniMax,背后不乏騰訊、小米、美團、阿里巴巴等身影。
總而言之,AI創(chuàng)新是一場馬拉松而非短跑,比拼的是耐力與毅力,無論BAT們這樣的頭部選手,還是DeepSeek這樣的初創(chuàng)企業(yè),都有彎道超車的機會,相互借力與借鑒才可以共同提高,大家都有美好的未來。
那么,神話DeepSeek大可不必。
原文標題 : 落選“果鏈”,別再捧殺DeepSeek了

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?