訂閱
糾錯(cuò)
加入自媒體

馬斯克發(fā)布大模型Grok 3,號(hào)稱性能超越DeepSeek和ChatGPT

前言:

2023年11月,xAI發(fā)布了其首款大型模型Grok-1,該模型擁有3140億參數(shù),成為當(dāng)時(shí)參數(shù)量最大的開(kāi)源大型語(yǔ)言模型;

2024年8月發(fā)布的Grok-2,在性能上可與最新的ChatGPT模型相媲美。

該系列大型模型能夠通過(guò)網(wǎng)絡(luò)連接獲取實(shí)時(shí)信息,并利用X平臺(tái)(原推特)上的資訊,從而保持信息獲取的時(shí)效性。

作者 | 方文三

圖片來(lái)源 |  網(wǎng) 絡(luò) 

圖片

馬斯克發(fā)布AI大模型Grok 3

埃隆·馬斯克提前展示了其強(qiáng)大的AI技術(shù),與OpenAI o1、DeepSeek-V3/R1等模型展開(kāi)競(jìng)爭(zhēng)。

在北京時(shí)間2月18日,馬斯克領(lǐng)導(dǎo)的AI團(tuán)隊(duì)以類似發(fā)布會(huì)的形式,與三位技術(shù)負(fù)責(zé)人共同展示了Grok 3基座大模型。

此前,馬斯克曾贊譽(yù)其為[地球上最聰明的AI]。

同時(shí),xAI團(tuán)隊(duì)還公布了推理AI模型Grok3 mini(Reasoning,精簡(jiǎn)版),基于Grok 3的[深度思考](Deep thinking)的Agent智能搜索引擎,以及基于Grok App的獨(dú)立訂閱服務(wù)[Super Grok]。

圖片

具體而言,Grok3模型的訓(xùn)練計(jì)算量(能力)比前一代提升了10倍,采用了20萬(wàn)張GPU卡集群進(jìn)行訓(xùn)練。

在第一階段,使用了10萬(wàn)個(gè)GPU進(jìn)行了122天的全面訓(xùn)練同步;在第二階段,又?jǐn)U展到20萬(wàn)張GPU卡,再次進(jìn)行了92天的訓(xùn)練和推理。

在技術(shù)參數(shù)方面,Grok 3模型配備了20萬(wàn)GPU,其計(jì)算能力相較于Grok2提升了10倍,同樣是一個(gè)推理模型,并具備DeepSearch功能;而B(niǎo)ig Brain功能則是通過(guò)更多的計(jì)算資源來(lái)解決問(wèn)題。

依據(jù)xAI所提供的評(píng)估標(biāo)準(zhǔn),Grok 3在科學(xué)、編程及數(shù)學(xué)領(lǐng)域的表現(xiàn)超越了Gemini 2 Pro、Deepseek V3、ChatGPT 4o等競(jìng)爭(zhēng)產(chǎn)品。

此外,在盲測(cè)環(huán)節(jié),xAI的早期版本Grok-3在lmArena排行榜上以1402分的歷史最高成績(jī)榮登榜首,成為首個(gè)突破1400分的AI模型,這一成就超越了Google、OpenAI、DeepSeek等業(yè)界主要競(jìng)爭(zhēng)者。

埃隆·馬斯克強(qiáng)調(diào),Grok-3能夠降低AI的幻覺(jué)效應(yīng),其方法在于反復(fù)核查數(shù)據(jù)并努力實(shí)現(xiàn)邏輯一致性。

他進(jìn)一步透露,相較于先前版本,Grok-3的訓(xùn)練過(guò)程消耗了更多的計(jì)算資源,并且大量應(yīng)用了合成數(shù)據(jù)。

與DeepSeek算法優(yōu)化路徑(DeepSeek-V3使用2048個(gè)H800 GPU,訓(xùn)練耗時(shí)2788千小時(shí))不同。

xAI公司透露,Grok-3的開(kāi)發(fā)得益于一座名為Colossus的超級(jí)計(jì)算機(jī),該計(jì)算機(jī)僅用8個(gè)月時(shí)間建成,由10萬(wàn)個(gè)英偉達(dá)H100 GPU提供動(dòng)力,為訓(xùn)練提供了2億個(gè)GPU小時(shí),這一數(shù)字是Grok-2的十多倍。

馬斯克還透露,Grok 3的語(yǔ)音交互功能即將推出,并承諾每次發(fā)布新版本時(shí)會(huì)開(kāi)源上一個(gè)版本,這體現(xiàn)了xAI對(duì)技術(shù)透明度和共享的重視。

Grok 3發(fā)布后,業(yè)界普遍認(rèn)為,特斯拉的FSD(全自動(dòng)駕駛系統(tǒng))以及特斯拉的人形機(jī)器人擎天柱可能是主要受益者。

有消息稱,馬斯克已經(jīng)將Grok 3集成到特斯拉汽車中,利用特斯拉多年積累的車輛傳感器數(shù)據(jù)和SpaceX的航天技術(shù)資料。

Grok 3能夠?qū)崟r(shí)解析道路積水深度、預(yù)測(cè)相鄰車輛的行駛軌跡,甚至提前30天預(yù)測(cè)電池故障。

圖片

Gork3架構(gòu)中的深度搜索模塊引人關(guān)注

此外,xAI正致力于為Grok打造深度搜索功能(DeepSearch),該功能預(yù)期將成為其AI體的關(guān)鍵能力之一。

DeepSearch是一款具備推理能力的聊天機(jī)器人,它能夠詳細(xì)解釋其對(duì)查詢內(nèi)容的理解過(guò)程以及制定回復(fù)策略的方式。

展示中表明,DeepSearch具備研究、創(chuàng)意發(fā)散和數(shù)據(jù)分析等多項(xiàng)功能。

馬斯克團(tuán)隊(duì)亦透露,他們計(jì)劃[盡快]推出一款基于語(yǔ)音交互的聊天機(jī)器人。

該模塊具備迅速檢索并驗(yàn)證信息的能力,為用戶提供精確的答案。

其設(shè)計(jì)理念借鑒了當(dāng)前最先進(jìn)的搜索引擎技術(shù),并且Gork3在這一基礎(chǔ)上進(jìn)行了顯著的改進(jìn)和優(yōu)化。

深度搜索模塊不僅能夠模擬人類的搜索行為,迅速檢索大量信息,而且還能通過(guò)推理和驗(yàn)證確保信息的可靠性。

在搜索過(guò)程中,Gork3會(huì)展示一個(gè)高級(jí)進(jìn)度條,實(shí)時(shí)反映其思考和搜索的進(jìn)度。

搜索任務(wù)完成后,界面的右側(cè)將呈現(xiàn)查詢模型的啟動(dòng)摘要,涵蓋瀏覽的網(wǎng)站、驗(yàn)證的來(lái)源等詳細(xì)信息,并且通常會(huì)進(jìn)行多源交叉驗(yàn)證,以確保答案的精確無(wú)誤。

圖片

結(jié)尾:在收購(gòu)OpenAI未果后計(jì)劃融資

在DeepSeek大型模型推出之后,業(yè)界開(kāi)始關(guān)注是否還需要依賴[大規(guī)模堆疊芯片和計(jì)算資源]這種昂貴方式來(lái)推動(dòng)AI的發(fā)展。

OpenAI的首席執(zhí)行官奧爾特曼此前表示,DeepSeek使得OpenAI的領(lǐng)先優(yōu)勢(shì)不再像前幾年那樣顯著。

他指出,在開(kāi)源模型和研究成果方面,OpenAI已經(jīng)站在了歷史的錯(cuò)誤一邊,因此需要制定不同的開(kāi)源策略。

在馬斯克xAI新模型發(fā)布前數(shù)小時(shí)內(nèi),奧爾特曼通過(guò)推特發(fā)布了幾條信息,試圖轉(zhuǎn)移公眾對(duì)xAI發(fā)布會(huì)的注意力,釋放了GPT-4.5、開(kāi)源等關(guān)鍵信息。

實(shí)際上,馬斯克領(lǐng)導(dǎo)的投資者財(cái)團(tuán)在2月10日提出了以974億美元收購(gòu)OpenAI的提議。

馬斯克的律師馬克·托貝羅夫確認(rèn)了這一消息,并表示已向OpenAI董事會(huì)提交了收購(gòu)要約。

一旦交易完成,OpenAI很可能會(huì)與xAI合并,這將有助于xAI迅速縮小技術(shù)差距,并形成一個(gè)能與谷歌、微軟等巨頭競(jìng)爭(zhēng)的AI企業(yè)。

如果這一收購(gòu)計(jì)劃得以實(shí)現(xiàn),它將成為全球AI領(lǐng)域最大規(guī)模的并購(gòu)交易,為全球AI行業(yè)未來(lái)的發(fā)展帶來(lái)不確定性,并可能加劇馬斯克與奧爾特曼之間的長(zhǎng)期矛盾。

圖片

然而,隨著馬斯克提出以974億美元收購(gòu)OpenAI的消息傳出,奧爾特曼并未表示支持。

對(duì)于收購(gòu)要約,他在社交媒體上回應(yīng)稱:[不,謝謝。但如果你愿意的話,我們可以考慮以97.4億美元收購(gòu)?fù)铺。]

2月16日,OpenAI董事會(huì)正式拒絕了馬斯克的收購(gòu)提議。

這一目標(biāo)未能實(shí)現(xiàn),同時(shí)xAI也面臨著融資挑戰(zhàn)。

據(jù)報(bào)道,xAI計(jì)劃籌集約100億美元資金,目前正在與潛在投資者如紅杉資本、Andreessen Horowitz等進(jìn)行接觸,此輪融資可能使公司估值達(dá)到約750億美元。

部分資料參考:鈦媒體AGI:《馬斯克Grok 3來(lái)襲,性能超DeepSeek,OpenAI加緊圍堵》,華夏時(shí)報(bào):《馬斯克發(fā)布最新一代大模型Grok 3,多模態(tài)AI或改變未來(lái)出行體驗(yàn)》,ITPUB:《大模型戰(zhàn)事再起,馬斯克發(fā)布[史上最聰明AI]Grok 3,稱超越DeepSeek》,算力豹:《馬斯克推出Grok-3大模型:算力碾壓、推理能力全球登頂,反擊DeepSeek、OpenAI》,騰訊科技:《馬斯克狂吹的Grok 3,終于發(fā)布了》

       原文標(biāo)題 : AI芯天下丨熱點(diǎn)丨馬斯克發(fā)布大模型Grok 3,號(hào)稱性能超越DeepSeek和ChatGPT

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)