OpenAl終于出手!官宣開源新模型,這次是摸著 Deepseek過河
編輯:Yuki | ID:YukiYuki1108
在暗示推出一款開源模型的一個(gè)多月后(2025年4月1日),OpenAI CEO山姆·奧特曼(Sam Altman)在社交平臺(tái)X上正式宣布:OpenAI計(jì)劃在未來幾個(gè)月內(nèi)發(fā)布一款具備推理能力的“開放權(quán)重”(open-weight)大模型。這一消息迅速引發(fā)了科技媒體和行業(yè)觀察者的廣泛關(guān)注。許多中文媒體以“OpenAI預(yù)告/即將發(fā)布開源模型”為標(biāo)題進(jìn)行報(bào)道;一些業(yè)內(nèi)人士則將其視為OpenAI重新走向開源的標(biāo)志性一步。
然而,“開放權(quán)重”是否等同于“開源”?這一問題的答案并不簡(jiǎn)單。從OpenAI的措辭
到行業(yè)實(shí)踐,“開放權(quán)重”與“開源”之間存在著顯著差異。本文將深入探討這一話題。
一、“開放權(quán)重”與“開源”:概念辨析
首先需要明確的是,“開放權(quán)重”(open-weight)與“開源”(open-source)是兩個(gè)不同的概念。
“開放權(quán)重”:指的是在模型訓(xùn)練完成后公開其參數(shù)(weights),允許開發(fā)者基于這些參數(shù)進(jìn)行部署、測(cè)試甚至微調(diào)。然而,“開放權(quán)重”并不包括訓(xùn)練數(shù)據(jù)、完整訓(xùn)練代碼或明確的使用權(quán)限。這意味著開發(fā)者可以利用這些參數(shù)進(jìn)行本地部署和推理服務(wù)(如對(duì)話生成或文本分類),但無法復(fù)現(xiàn)完整的訓(xùn)練過程或完全自由地修改模型的底層架構(gòu)。
“開源”:則是一個(gè)更廣泛的概念。它不僅包括代碼公開(如訓(xùn)練代碼和推理代碼),還可能涉及訓(xùn)練數(shù)據(jù)、方法透明性以及使用權(quán)限的自由度。開源的核心理念是全面透明和自由使用。
從這個(gè)角度來看,“開放權(quán)重”更像是開源的一個(gè)子集——它降低了模型的使用門檻(如本地部署和微調(diào)),但無法滿足真正的可驗(yàn)證性與可重現(xiàn)性需求。
二、行業(yè)實(shí)踐:“開放權(quán)重”已成為主流
盡管“開放權(quán)重”與“開源”存在差異(如缺少訓(xùn)練數(shù)據(jù)和完整
訓(xùn)練代碼),但從行業(yè)實(shí)踐來看,“開放權(quán)重”已經(jīng)成為當(dāng)前大模型的主流模式。
以DeepSeek、Qwen(阿里)和LLaMA(Meta)為例:
DeepSeek:其V2、V3和R1等系列均采用了“開放權(quán)重”策略。此外DeepSeek還提供了技術(shù)報(bào)告并采用了限制極少的MIT開源協(xié)議——允許任何人自由地使用、修改、分發(fā)和商業(yè)化軟件或模型。
Qwen(阿里):Qwen系列不僅公開了權(quán)重還采用了Apache2.0協(xié)議——允許用戶自由地使用修改分發(fā)代碼包括商業(yè)用途僅要求保留原始版權(quán)聲明許可聲明。
LLaMA(Meta):雖然LLaMA系列也公開了參數(shù)推理腳本但其使用協(xié)議限制更多從LLaMA2開始Meta采用了更寬松許可證(LLaMA3又更開放了一點(diǎn))但仍需申請(qǐng)使用且不能直接用于某些商業(yè)應(yīng)用發(fā)布服務(wù)導(dǎo)致其落地場(chǎng)景受限。
這些案例表明盡管三者都自稱“開源”,但如果將“開源”拆解為幾個(gè)維度來看——如是否公開完整訓(xùn)練數(shù)據(jù)是否提供可復(fù)現(xiàn)訓(xùn)練代碼等——你會(huì)發(fā)現(xiàn)沒有一家是真正意義上做到全開。
三、“o3-mini級(jí)別”:OpenAI新模型的定位
根據(jù)Sam Altman在今年2月的暗示以及最新推文中提到的“powerful new open-weight model with reasoning”,可以推測(cè)出OpenAI在開源路線上最終選擇了一個(gè)“o3-mini級(jí)別”的推理型大語言來打開局面。
所謂“o3-mini級(jí)別”,指的是具備較強(qiáng)推理能力且適合輕量化部署的中小型大語言——這類既能夠滿足企業(yè)級(jí)應(yīng)用需求又能夠降低硬件成本使其成為當(dāng)前市場(chǎng)上最受歡迎類型之一。
四、“重返”還是“妥協(xié)”?
對(duì)于OpenAI來說這次重返社區(qū)意義遠(yuǎn)不止發(fā)布那么簡(jiǎn)單過去兩年間Meta Mistral Qwen DeepSeek輪番上場(chǎng)一邊打造一邊打造生態(tài)甚至逐漸形成規(guī)模龐大生態(tài)尤其在DeepSeek-V3/R1之后越來越多硬件軟件廠商加入其中使得整個(gè)行業(yè)格局發(fā)生顯著變化而作為曾經(jīng)引領(lǐng)者卻因閉源策略逐漸被邊緣化因此這次部分回歸可以看作是對(duì)競(jìng)爭(zhēng)壓力回應(yīng)同時(shí)也是對(duì)自身定位調(diào)整。
五、“真開”還是“假開”?
盡管很多人以為是以起家但實(shí)際上至少在GPT-2時(shí)期就有了閉源路線打算2019年初GPT-2發(fā)布開始以惡意使用風(fēng)險(xiǎn)名義拒絕公開但在外界一致認(rèn)為夸大風(fēng)險(xiǎn)輿論下才在年底公開滿血版15億參數(shù)GPT-2不論如何從GPT-3開始徹底走上閉源路線不再公開權(quán)重代碼或訓(xùn)練數(shù)據(jù)因此這一次重新也可以視為對(duì)社區(qū)釋放信號(hào)但需要明確是從Sam Altman采用字眼來看大概率將和今天DeepSeek Qwen LLaMA一樣:
優(yōu)點(diǎn):降低門檻支持本地部署微調(diào)適配缺點(diǎn):無法復(fù)現(xiàn)完整過程難以滿足真正需求
原文標(biāo)題 : OpenAl終于出手!官宣開源新模型,這次是摸著 Deepseek過河

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?