馬斯克發(fā)布大模型Grok 3,號(hào)稱性能超越DeepSeek和ChatGPT
前言:
2023年11月,xAI發(fā)布了其首款大型模型Grok-1,該模型擁有3140億參數(shù),成為當(dāng)時(shí)參數(shù)量最大的開(kāi)源大型語(yǔ)言模型;
2024年8月發(fā)布的Grok-2,在性能上可與最新的ChatGPT模型相媲美。
該系列大型模型能夠通過(guò)網(wǎng)絡(luò)連接獲取實(shí)時(shí)信息,并利用X平臺(tái)(原推特)上的資訊,從而保持信息獲取的時(shí)效性。
作者 | 方文三
圖片來(lái)源 | 網(wǎng) 絡(luò)
馬斯克發(fā)布AI大模型Grok 3
埃隆·馬斯克提前展示了其強(qiáng)大的AI技術(shù),與OpenAI o1、DeepSeek-V3/R1等模型展開(kāi)競(jìng)爭(zhēng)。
在北京時(shí)間2月18日,馬斯克領(lǐng)導(dǎo)的AI團(tuán)隊(duì)以類似發(fā)布會(huì)的形式,與三位技術(shù)負(fù)責(zé)人共同展示了Grok 3基座大模型。
此前,馬斯克曾贊譽(yù)其為[地球上最聰明的AI]。
同時(shí),xAI團(tuán)隊(duì)還公布了推理AI模型Grok3 mini(Reasoning,精簡(jiǎn)版),基于Grok 3的[深度思考](Deep thinking)的Agent智能搜索引擎,以及基于Grok App的獨(dú)立訂閱服務(wù)[Super Grok]。
具體而言,Grok3模型的訓(xùn)練計(jì)算量(能力)比前一代提升了10倍,采用了20萬(wàn)張GPU卡集群進(jìn)行訓(xùn)練。
在第一階段,使用了10萬(wàn)個(gè)GPU進(jìn)行了122天的全面訓(xùn)練同步;在第二階段,又?jǐn)U展到20萬(wàn)張GPU卡,再次進(jìn)行了92天的訓(xùn)練和推理。
在技術(shù)參數(shù)方面,Grok 3模型配備了20萬(wàn)GPU,其計(jì)算能力相較于Grok2提升了10倍,同樣是一個(gè)推理模型,并具備DeepSearch功能;而B(niǎo)ig Brain功能則是通過(guò)更多的計(jì)算資源來(lái)解決問(wèn)題。
依據(jù)xAI所提供的評(píng)估標(biāo)準(zhǔn),Grok 3在科學(xué)、編程及數(shù)學(xué)領(lǐng)域的表現(xiàn)超越了Gemini 2 Pro、Deepseek V3、ChatGPT 4o等競(jìng)爭(zhēng)產(chǎn)品。
此外,在盲測(cè)環(huán)節(jié),xAI的早期版本Grok-3在lmArena排行榜上以1402分的歷史最高成績(jī)榮登榜首,成為首個(gè)突破1400分的AI模型,這一成就超越了Google、OpenAI、DeepSeek等業(yè)界主要競(jìng)爭(zhēng)者。
埃隆·馬斯克強(qiáng)調(diào),Grok-3能夠降低AI的幻覺(jué)效應(yīng),其方法在于反復(fù)核查數(shù)據(jù)并努力實(shí)現(xiàn)邏輯一致性。
他進(jìn)一步透露,相較于先前版本,Grok-3的訓(xùn)練過(guò)程消耗了更多的計(jì)算資源,并且大量應(yīng)用了合成數(shù)據(jù)。
與DeepSeek算法優(yōu)化路徑(DeepSeek-V3使用2048個(gè)H800 GPU,訓(xùn)練耗時(shí)2788千小時(shí))不同。
xAI公司透露,Grok-3的開(kāi)發(fā)得益于一座名為Colossus的超級(jí)計(jì)算機(jī),該計(jì)算機(jī)僅用8個(gè)月時(shí)間建成,由10萬(wàn)個(gè)英偉達(dá)H100 GPU提供動(dòng)力,為訓(xùn)練提供了2億個(gè)GPU小時(shí),這一數(shù)字是Grok-2的十多倍。
馬斯克還透露,Grok 3的語(yǔ)音交互功能即將推出,并承諾每次發(fā)布新版本時(shí)會(huì)開(kāi)源上一個(gè)版本,這體現(xiàn)了xAI對(duì)技術(shù)透明度和共享的重視。
Grok 3發(fā)布后,業(yè)界普遍認(rèn)為,特斯拉的FSD(全自動(dòng)駕駛系統(tǒng))以及特斯拉的人形機(jī)器人擎天柱可能是主要受益者。
有消息稱,馬斯克已經(jīng)將Grok 3集成到特斯拉汽車中,利用特斯拉多年積累的車輛傳感器數(shù)據(jù)和SpaceX的航天技術(shù)資料。
Grok 3能夠?qū)崟r(shí)解析道路積水深度、預(yù)測(cè)相鄰車輛的行駛軌跡,甚至提前30天預(yù)測(cè)電池故障。
Gork3架構(gòu)中的深度搜索模塊引人關(guān)注
此外,xAI正致力于為Grok打造深度搜索功能(DeepSearch),該功能預(yù)期將成為其AI體的關(guān)鍵能力之一。
DeepSearch是一款具備推理能力的聊天機(jī)器人,它能夠詳細(xì)解釋其對(duì)查詢內(nèi)容的理解過(guò)程以及制定回復(fù)策略的方式。
展示中表明,DeepSearch具備研究、創(chuàng)意發(fā)散和數(shù)據(jù)分析等多項(xiàng)功能。
馬斯克團(tuán)隊(duì)亦透露,他們計(jì)劃[盡快]推出一款基于語(yǔ)音交互的聊天機(jī)器人。
該模塊具備迅速檢索并驗(yàn)證信息的能力,為用戶提供精確的答案。
其設(shè)計(jì)理念借鑒了當(dāng)前最先進(jìn)的搜索引擎技術(shù),并且Gork3在這一基礎(chǔ)上進(jìn)行了顯著的改進(jìn)和優(yōu)化。
深度搜索模塊不僅能夠模擬人類的搜索行為,迅速檢索大量信息,而且還能通過(guò)推理和驗(yàn)證確保信息的可靠性。
在搜索過(guò)程中,Gork3會(huì)展示一個(gè)高級(jí)進(jìn)度條,實(shí)時(shí)反映其思考和搜索的進(jìn)度。
搜索任務(wù)完成后,界面的右側(cè)將呈現(xiàn)查詢模型的啟動(dòng)摘要,涵蓋瀏覽的網(wǎng)站、驗(yàn)證的來(lái)源等詳細(xì)信息,并且通常會(huì)進(jìn)行多源交叉驗(yàn)證,以確保答案的精確無(wú)誤。
結(jié)尾:在收購(gòu)OpenAI未果后計(jì)劃融資
在DeepSeek大型模型推出之后,業(yè)界開(kāi)始關(guān)注是否還需要依賴[大規(guī)模堆疊芯片和計(jì)算資源]這種昂貴方式來(lái)推動(dòng)AI的發(fā)展。
OpenAI的首席執(zhí)行官奧爾特曼此前表示,DeepSeek使得OpenAI的領(lǐng)先優(yōu)勢(shì)不再像前幾年那樣顯著。
他指出,在開(kāi)源模型和研究成果方面,OpenAI已經(jīng)站在了歷史的錯(cuò)誤一邊,因此需要制定不同的開(kāi)源策略。
在馬斯克xAI新模型發(fā)布前數(shù)小時(shí)內(nèi),奧爾特曼通過(guò)推特發(fā)布了幾條信息,試圖轉(zhuǎn)移公眾對(duì)xAI發(fā)布會(huì)的注意力,釋放了GPT-4.5、開(kāi)源等關(guān)鍵信息。
實(shí)際上,馬斯克領(lǐng)導(dǎo)的投資者財(cái)團(tuán)在2月10日提出了以974億美元收購(gòu)OpenAI的提議。
馬斯克的律師馬克·托貝羅夫確認(rèn)了這一消息,并表示已向OpenAI董事會(huì)提交了收購(gòu)要約。
一旦交易完成,OpenAI很可能會(huì)與xAI合并,這將有助于xAI迅速縮小技術(shù)差距,并形成一個(gè)能與谷歌、微軟等巨頭競(jìng)爭(zhēng)的AI企業(yè)。
如果這一收購(gòu)計(jì)劃得以實(shí)現(xiàn),它將成為全球AI領(lǐng)域最大規(guī)模的并購(gòu)交易,為全球AI行業(yè)未來(lái)的發(fā)展帶來(lái)不確定性,并可能加劇馬斯克與奧爾特曼之間的長(zhǎng)期矛盾。
然而,隨著馬斯克提出以974億美元收購(gòu)OpenAI的消息傳出,奧爾特曼并未表示支持。
對(duì)于收購(gòu)要約,他在社交媒體上回應(yīng)稱:[不,謝謝。但如果你愿意的話,我們可以考慮以97.4億美元收購(gòu)?fù)铺。]
2月16日,OpenAI董事會(huì)正式拒絕了馬斯克的收購(gòu)提議。
這一目標(biāo)未能實(shí)現(xiàn),同時(shí)xAI也面臨著融資挑戰(zhàn)。
據(jù)報(bào)道,xAI計(jì)劃籌集約100億美元資金,目前正在與潛在投資者如紅杉資本、Andreessen Horowitz等進(jìn)行接觸,此輪融資可能使公司估值達(dá)到約750億美元。
部分資料參考:鈦媒體AGI:《馬斯克Grok 3來(lái)襲,性能超DeepSeek,OpenAI加緊圍堵》,華夏時(shí)報(bào):《馬斯克發(fā)布最新一代大模型Grok 3,多模態(tài)AI或改變未來(lái)出行體驗(yàn)》,ITPUB:《大模型戰(zhàn)事再起,馬斯克發(fā)布[史上最聰明AI]Grok 3,稱超越DeepSeek》,算力豹:《馬斯克推出Grok-3大模型:算力碾壓、推理能力全球登頂,反擊DeepSeek、OpenAI》,騰訊科技:《馬斯克狂吹的Grok 3,終于發(fā)布了》
原文標(biāo)題 : AI芯天下丨熱點(diǎn)丨馬斯克發(fā)布大模型Grok 3,號(hào)稱性能超越DeepSeek和ChatGPT

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?