3分鐘看懂大模型開(kāi)閉源戰(zhàn)爭(zhēng),誰(shuí)將主宰未來(lái)?
2月14日,百度宣布開(kāi)源!百度稱將在未來(lái)幾個(gè)月中陸續(xù)推出文心大模型4.5系列,并于6月30日起正式開(kāi)源。
自DeepSeek開(kāi)源之風(fēng)席卷全球后,開(kāi)源閉源路徑選擇一直是AI領(lǐng)域熱議焦點(diǎn)。連此前堅(jiān)持閉源的百度都轉(zhuǎn)投開(kāi)源陣營(yíng),足見(jiàn)開(kāi)源之勢(shì)已占據(jù)上風(fēng)。今天我們就來(lái)聊聊開(kāi)源和閉源的優(yōu)劣勢(shì),到底大模型開(kāi)源和軟件開(kāi)源有什么區(qū)別?開(kāi)閉源的商業(yè)化應(yīng)用到底如何選擇?文末可免費(fèi)獲取30份大模型行業(yè)研究報(bào)告
01開(kāi)源和閉源的優(yōu)劣勢(shì)
“開(kāi)源”一詞源自軟件領(lǐng)域,指在軟件開(kāi)發(fā)過(guò)程中公開(kāi)其源代碼,允許任何人查看、修改和分發(fā)。開(kāi)源軟件的開(kāi)發(fā)通常遵循互惠合作和同儕生產(chǎn)的原則,促進(jìn)了生產(chǎn)模塊、通信管道和交互社區(qū)的改進(jìn),典型代表包括Linux,Mozilla Firefox,安卓。
閉源軟件(專(zhuān)有軟件)由于商業(yè)模式等其他原因,不公開(kāi)源代碼,只提供計(jì)算機(jī)可讀的程序(如二進(jìn)制格式)。源代碼僅由開(kāi)發(fā)者掌握和控制。典型代表包括Windows,IOS。
開(kāi)源是一種軟件開(kāi)發(fā)模式,基于開(kāi)放、共享和協(xié)作,鼓勵(lì)大家共同參與軟件的開(kāi)發(fā)和改進(jìn),推動(dòng)技術(shù)的不斷進(jìn)步和廣泛應(yīng)用。也是開(kāi)源派倡導(dǎo)的技術(shù)平權(quán),不應(yīng)該讓少數(shù)人壟斷技術(shù)。
選擇閉源開(kāi)發(fā)的軟件更有可能成為一個(gè)穩(wěn)定、專(zhuān)注的產(chǎn)品,但是閉源軟件通常需要花錢(qián),且如果它有任何錯(cuò)誤或缺少功能,只能等待開(kāi)發(fā)商來(lái)解決問(wèn)題。
開(kāi)源與閉源既是技術(shù)策略,更是商業(yè)策略。表面上是發(fā)展路線之爭(zhēng),實(shí)則是利益之爭(zhēng)。
開(kāi)源與閉源確實(shí)各有利弊。
開(kāi)源在推進(jìn)技術(shù)平權(quán),讓更多人享受技術(shù)的同時(shí),也會(huì)讓大家“拿來(lái)主義”,不會(huì)再考慮底層的創(chuàng)新了。TrainiCEO孫鄰家認(rèn)為,“技術(shù)過(guò)度平權(quán)不一定是好事,會(huì)失去創(chuàng)新的驅(qū)動(dòng)力。”
閉源因?yàn)榧夹g(shù)壟斷,商業(yè)化上能賺取更大利潤(rùn),在技術(shù)底層創(chuàng)新能投入更大資源。而且閉源更能成為一個(gè)穩(wěn)定、安全、專(zhuān)注的產(chǎn)品。
我們想想當(dāng)年的以蘋(píng)果為代表的IOS系統(tǒng),和谷歌為代表的安卓系統(tǒng),就深有體會(huì)。大眾消費(fèi)者直觀體會(huì),就是蘋(píng)果系統(tǒng)不卡,安卓卡的要死。當(dāng)年小米MIUI大受歡迎,就是在安卓開(kāi)源底層做的優(yōu)化,讓廣大手機(jī)用戶體驗(yàn)大幅提升。不是美國(guó)的封鎖,華為也沒(méi)有動(dòng)力大力投入鴻蒙系統(tǒng)的研發(fā)上,經(jīng)濟(jì)賬算不過(guò)來(lái)。只是被逼的沒(méi)辦法了,才逼出了鴻蒙系統(tǒng)。
開(kāi)源和閉源是一個(gè)硬幣的兩面。
開(kāi)源、閉源其實(shí)都存在透明性、合規(guī)性、安全性的問(wèn)題,也涉及治理問(wèn)題。開(kāi)源可能促進(jìn)我們更多的探索性和基礎(chǔ)性工作;閉源更多促進(jìn)產(chǎn)品化和商業(yè)化,推動(dòng)技術(shù)走進(jìn)每個(gè)人的生活。這兩件事其實(shí)不應(yīng)該是之爭(zhēng),而是和諧共存。
02開(kāi)源大模型與開(kāi)源軟件有三大區(qū)別
大模型開(kāi)源和傳統(tǒng)軟件開(kāi)源不是一回事。
軟件開(kāi)源是指源代碼開(kāi)源,拿到源代碼,我們就知其然也知其所以然,也可以在源代碼基礎(chǔ)上,去修改或增加新功能。
但大模型是一個(gè)黑盒子,里面有很多至今無(wú)法解釋的現(xiàn)象,所以對(duì)大模型的開(kāi)源,業(yè)界提出了更多維度,有的說(shuō)需要四部分——權(quán)重、數(shù)據(jù)集、代碼和訓(xùn)練過(guò)程;也有的說(shuō)需要五部分,還包括了框架。即使是這些定義,業(yè)界也有不同意見(jiàn):為什么會(huì)有這樣的定義?這更像是從傳統(tǒng)開(kāi)源軟件的思路來(lái)考慮的。
有趣的是,只有極少數(shù)公司或機(jī)構(gòu)的大模型,同時(shí)開(kāi)源了上述四部分或五部分,比如IBM剛剛開(kāi)源出來(lái)的Granite大語(yǔ)言模型;也有像智源研究院、馬斯克旗下大模型公司xAI ,開(kāi)源了權(quán)重和數(shù)據(jù)集。比如,根據(jù)智源人工智能研究院副院長(zhǎng)兼總工程師林詠華的介紹,智源最新開(kāi)源數(shù)據(jù)集分為兩類(lèi),一類(lèi)是通用開(kāi)源指令微調(diào)數(shù)據(jù)集,一類(lèi)是行業(yè)垂類(lèi)數(shù)據(jù)集,涵蓋18個(gè)行業(yè)。
“現(xiàn)在業(yè)界的共識(shí)是,至少將權(quán)重再加上一些推理代碼開(kāi)源。”零一萬(wàn)物林旅強(qiáng)說(shuō),只有這兩部分開(kāi)源,其他人才可以將開(kāi)源大模型使用起來(lái)。由此,開(kāi)源大模型現(xiàn)在的定義,有點(diǎn)像微軟提過(guò)的“免費(fèi)軟件”。所以,谷歌等公司在其官網(wǎng)上稱是開(kāi)源權(quán)重(open weight),而不是開(kāi)源大模型。
為什么在開(kāi)源大模型中,權(quán)重如此重要?有業(yè)界人士將權(quán)重打比方為“一大堆數(shù)字”,一個(gè)13B的模型,就有130億個(gè)數(shù)。這些數(shù)字與模型如何處理輸入的數(shù)據(jù)、如何做出預(yù)測(cè)和生成文本等相關(guān),代表了一個(gè)大模型的智慧。
而在大模型中,代碼分為預(yù)訓(xùn)練代碼、微調(diào)代碼和推理代碼。預(yù)訓(xùn)練代碼是大模型公司的核心;對(duì)于微調(diào)代碼,市場(chǎng)上已有很多公開(kāi)方法,而大模型要被用起來(lái),需要推理代碼。至于訓(xùn)練過(guò)程和數(shù)據(jù)集,往往也是大模型廠商的核心所在。
與傳統(tǒng)軟件不同,在大模型開(kāi)源上,企業(yè)的態(tài)度有了微妙的變化,F(xiàn)在大模型的成本太過(guò)高昂,訓(xùn)練一個(gè)千億級(jí)參數(shù)模型,要幾千萬(wàn)甚至上億,因此,很多公司在開(kāi)源問(wèn)題上變得保守。這是一個(gè)現(xiàn)實(shí)問(wèn)題,每家公司的開(kāi)源,必然服務(wù)于自己的商業(yè)戰(zhàn)略。而且,即便將這些核心都開(kāi)源出來(lái),大多數(shù)工程師和企業(yè)也沒(méi)有那么多資源去復(fù)現(xiàn)。
業(yè)內(nèi)人士認(rèn)為,開(kāi)源大模型和開(kāi)源軟件有三個(gè)核心區(qū)別:
一是透明度完全不一樣。開(kāi)源軟件的代碼能說(shuō)明一切,從而可以形成一套治理體系;大模型當(dāng)下還是一個(gè)黑盒子,內(nèi)部機(jī)理還是未知的。
二是大模型社區(qū)的性質(zhì)發(fā)生了變化。之前開(kāi)源社區(qū)講求全球工程師來(lái)貢獻(xiàn);但因?yàn)樗懔Φ荣Y源限制,在大模型社區(qū)里,或許90%以上的工程師,無(wú)法直接為大模型貢獻(xiàn),因此很多社區(qū)變成了單向模式,大家只是使用大模型。在HuggingFace上,Meta的Llmma開(kāi)源大模型,已經(jīng)有幾千個(gè)變種,但彼此之間沒(méi)有太多交互,也很難將創(chuàng)新合并。
其三是大模型企業(yè)開(kāi)源策略發(fā)生變化。中國(guó)信通院知識(shí)產(chǎn)權(quán)與創(chuàng)新發(fā)展中心產(chǎn)業(yè)發(fā)展研究部主任張俊霞說(shuō),因?yàn)榇竽P偷挠?xùn)練投入特別大,這導(dǎo)致企業(yè)在開(kāi)源策略的選擇上,特別是在一些許可或信息披露上,都有很大不同。“這個(gè)問(wèn)題現(xiàn)在不管是國(guó)內(nèi)還是國(guó)際社區(qū),都在非常激烈地討論。”
開(kāi)源的目的不是一定要超越閉源。
單純把開(kāi)源模型和閉源模型放在一起來(lái)比較,可能有失公允。因?yàn)殚]源大模型可能是一套體系,比如包含了檢索增強(qiáng)等技術(shù),而開(kāi)源模型是一個(gè)單體模型,拿“多對(duì)一”,肯定不合理。
開(kāi)源的價(jià)值是更加公開(kāi)透明,技術(shù)上更加平權(quán),不會(huì)讓其成為少數(shù)人牟利的手段。“更為關(guān)鍵的是,對(duì)于人工智能來(lái)說(shuō),如果未來(lái)走向AGI,開(kāi)源讓AI的發(fā)展走向,更符合全人類(lèi)的利益,這一點(diǎn)的價(jià)值要遠(yuǎn)高于在某一方面去超越閉源。”
而開(kāi)源和閉源大模型誰(shuí)更安全,業(yè)界也有著爭(zhēng)議。開(kāi)源派認(rèn)為,在閉源環(huán)境當(dāng)中,大家不知道有沒(méi)有人監(jiān)督它。開(kāi)源的好處是一旦出現(xiàn)一些安全問(wèn)題,整個(gè)社區(qū)會(huì)來(lái)共同檢查。
但也有人士認(rèn)為“開(kāi)源也會(huì)帶來(lái)各種意想不到的問(wèn)題”。比如,開(kāi)源可能將大模型交到了“恐怖分子”手里。“舉個(gè)例子,開(kāi)源大模型的數(shù)據(jù)集,如果別人加了一些數(shù)據(jù),訓(xùn)練出大模型去干了違法的事。”一家大模型企業(yè)開(kāi)源負(fù)責(zé)人說(shuō)。另外,現(xiàn)在各國(guó)都強(qiáng)調(diào)數(shù)據(jù)主權(quán),數(shù)據(jù)開(kāi)源后怎么追蹤也是問(wèn)題。所以國(guó)家鼓勵(lì)開(kāi)源,但不是無(wú)限制的開(kāi)源。
03
開(kāi)閉源,商業(yè)化如何選擇?
在開(kāi)閉源的選擇上,智譜張鵬認(rèn)為,如果只是想做一些實(shí)驗(yàn)和嘗試,可以選擇開(kāi)源模型,但如果想要在上面做商業(yè)化應(yīng)用,大部分人還是會(huì)選擇商業(yè)化版本,因?yàn)橛斜U,能夠提供更好的服?wù)。
這代表了業(yè)界、尤其是ToB行業(yè)很多人士的觀點(diǎn)。
無(wú)論是開(kāi)源、閉源,需要優(yōu)先考慮客戶是否需要本地部署大模型。無(wú)論國(guó)內(nèi)外,不少客戶都有自主可控的需求。如果采用公有云上的模型,比如OpenAI,客戶要考慮數(shù)據(jù)暴露信息的問(wèn)題。
值得注意的是,閉源大模型是否能部署到本地,需要獲得允許。開(kāi)源大模型同樣需要依據(jù)一些協(xié)議以及合規(guī)性。從技術(shù)角度來(lái)講,很多開(kāi)源部署到本地是可行的。而開(kāi)源可以方便地進(jìn)行微調(diào),打造行業(yè)大模型,這是其優(yōu)勢(shì)。
大模型的需求一定是開(kāi)放混合的。具體要結(jié)合行業(yè)和場(chǎng)景,比如政務(wù)領(lǐng)域,客戶對(duì)數(shù)據(jù)安全要求極高,不能觸碰紅線,需要私有化部署,開(kāi)源模型在這方面更為靈活方便。
結(jié)語(yǔ)
DeepSeek的開(kāi)源促使百度宣布開(kāi)源策略不僅僅是鯰魚(yú)效應(yīng),而是徹底地改變了大模型行業(yè)的玩法。
就像剛剛過(guò)去的阿聯(lián)酋迪拜World Governments Summit 2025峰會(huì)上,百度創(chuàng)始人李彥宏所說(shuō):“我認(rèn)為,創(chuàng)新是不能被計(jì)劃的。你不知道創(chuàng)新何時(shí)何地到來(lái),你所能做的是,營(yíng)造一個(gè)有利于創(chuàng)新的環(huán)境。”
無(wú)論是開(kāi)源還是閉源,無(wú)論是大廠還是創(chuàng)業(yè)者,面對(duì)技術(shù)更迭最好的辦法就是用魔法打敗魔法。
原文標(biāo)題 : 3分鐘看懂大模型開(kāi)閉源戰(zhàn)爭(zhēng),誰(shuí)將主宰未來(lái)?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?