123,123,123

<th id="c0j8u"></th>

<dd id="c0j8u"></dd>

當(dāng)前位置： OFweek 人工智能網(wǎng) > 正文

谷歌成立新團(tuán)隊(duì)模擬物理世界AI模型

2025-01-17 09:20

前言：如果能夠克服所有主要障礙，[世界模型]有望在虛擬世界生成、機(jī)器人技術(shù)和AI決策等領(lǐng)域帶來重大突破，為人工智能與現(xiàn)實(shí)世界的融合開辟新的途徑。

作者 | 方文三圖片來源 | 網(wǎng) 絡(luò)

谷歌成立新團(tuán)隊(duì)模擬物理世界AI模型

2025年初，谷歌向公眾明確傳達(dá)了其在人工智能領(lǐng)域的戰(zhàn)略意圖，表明今年將是公司在此領(lǐng)域發(fā)展的重要時(shí)期。

今年1月，谷歌宣布，負(fù)責(zé)AI Studio項(xiàng)目以及Gemini API開發(fā)的團(tuán)隊(duì)將整合并加入Google DeepMind部門。

此舉是繼去年將Gemini聊天機(jī)器人團(tuán)隊(duì)并入DeepMind之后的又一重大戰(zhàn)略決策。

目前，谷歌在人工智能研發(fā)方面的力量已完全整合至DeepMind部門，由2024年諾貝爾化學(xué)獎(jiǎng)得主德米斯·哈薩比斯領(lǐng)導(dǎo)。

隨著谷歌進(jìn)一步將人工智能團(tuán)隊(duì)并入DeepMind，這位在游戲開發(fā)、神經(jīng)科學(xué)及人工智能領(lǐng)域均有卓越貢獻(xiàn)的科學(xué)家，其影響力將更為顯著。

近期，谷歌已連續(xù)三次將人工智能團(tuán)隊(duì)并入DeepMind，此前已完成了模型研發(fā)、基礎(chǔ)研究以及負(fù)責(zé)任人工智能團(tuán)隊(duì)的整合。

1月6日，谷歌正式宣布成立一個(gè)專項(xiàng)團(tuán)隊(duì)，旨在開發(fā)能夠模擬物理世界的先進(jìn)人工智能大模型。

該團(tuán)隊(duì)由前OpenAI視頻生成項(xiàng)目Sora的聯(lián)合負(fù)責(zé)人蒂姆·布魯克斯領(lǐng)銜。

布魯克斯表示：[我們有志于構(gòu)建一個(gè)能夠模擬整個(gè)世界的大型生成式模型。]

根據(jù)公司發(fā)布的招聘信息，該團(tuán)隊(duì)將專注于解決[關(guān)鍵性新問題]，并將模型的性能提升至[最高計(jì)算水平]。

這支新成立的團(tuán)隊(duì)將與公司內(nèi)現(xiàn)有的Gemini、Veo和Genie等項(xiàng)目進(jìn)行深入合作，致力于提升人工智能對(duì)現(xiàn)實(shí)世界的認(rèn)知和模擬能力。

蒂姆·布魯克斯作為OpenAI視頻生成器Sora的共同領(lǐng)導(dǎo)者之一，于10月份離職，轉(zhuǎn)而加入了谷歌旗下的人工智能研究機(jī)構(gòu)DeepMind。

據(jù)相關(guān)報(bào)道，布魯克斯加入的新研究團(tuán)隊(duì)將致力于開發(fā)[實(shí)時(shí)交互生成]工具，并探索如何將他們所構(gòu)建的模型與現(xiàn)有的多模式模型（例如Gemini）進(jìn)行整合。

以開發(fā)能夠模擬真實(shí)場(chǎng)景的AI工具為目標(biāo)，Genie 2旨在為實(shí)現(xiàn)通用人工智能鋪平道路，并引領(lǐng)人工智能領(lǐng)域的新方向——利用尖端技術(shù)實(shí)現(xiàn)復(fù)雜物理環(huán)境的真實(shí)模擬，未來有望廣泛應(yīng)用于游戲、影視制作、機(jī)器人訓(xùn)練等多個(gè)領(lǐng)域。

DeepMind認(rèn)為，在視頻和多模態(tài)數(shù)據(jù)上進(jìn)行人工智能訓(xùn)練是實(shí)現(xiàn)通用人工智能（AGI）的關(guān)鍵路徑。

世界模型將在諸多領(lǐng)域發(fā)揮重要作用，包括視覺推理與模擬、具身代理的規(guī)劃以及實(shí)時(shí)互動(dòng)娛樂等。

Genie 2模型對(duì)構(gòu)建世界模型的積極一面

DeepMind已成功將SIMA技術(shù)融入由Genie 2所構(gòu)建的虛擬世界中，這一技術(shù)進(jìn)步預(yù)期將對(duì)人工智能的訓(xùn)練方法和游戲快速原型開發(fā)領(lǐng)域產(chǎn)生深遠(yuǎn)影響。

Genie 2模型的推出，體現(xiàn)了谷歌DeepMind在人工智能構(gòu)建虛擬世界領(lǐng)域的積極參與和競(jìng)爭態(tài)勢(shì)。

該模型作為一種基礎(chǔ)的人工智能工具，能夠?qū)我粓D像轉(zhuǎn)化為一個(gè)具有交互性的3D環(huán)境，并支持長達(dá)一分鐘的互動(dòng)體驗(yàn)。

該技術(shù)在多個(gè)維度上展現(xiàn)了其卓越的性能和優(yōu)勢(shì)，涵蓋了動(dòng)作控制、生成反事實(shí)場(chǎng)景、長期記憶、長視頻內(nèi)容生成、多樣化環(huán)境模擬、3D結(jié)構(gòu)建模、物體交互、復(fù)雜角色動(dòng)畫、NPC行為、物理效應(yīng)、煙霧模擬、光影效果以及快速原型設(shè)計(jì)等方面。

Genie 2的核心功能在于訓(xùn)練與評(píng)估具身智能體，其通過構(gòu)建多樣化環(huán)境，能夠生成智能體在訓(xùn)練過程中未曾遭遇的評(píng)估任務(wù)。

其工作原理是逐幀進(jìn)行[像素預(yù)測(cè)]，并利用用戶提供的[引導(dǎo)]信息來調(diào)整下一幀的概率分布。

Genie2 的功能包括具備[基礎(chǔ)世界模型的涌現(xiàn)能力]，能夠構(gòu)建出豐富多樣的三維世界，并能夠模擬在虛擬世界中進(jìn)行各種行為（例如跳躍、游泳等）所產(chǎn)生的結(jié)果。

Genie2 實(shí)現(xiàn)了讓任何用戶通過[文字]描述來構(gòu)建他們理想中的世界，選擇他們偏好的[效果圖]，隨后進(jìn)入這個(gè)新構(gòu)建的世界并進(jìn)行[互動(dòng)]，或者讓AI代理在其中進(jìn)行[訓(xùn)練或評(píng)估]。

該模型具備從單一圖像中構(gòu)建可交互3D環(huán)境的能力，并能夠提供長達(dá)一分鐘的沉浸式游戲體驗(yàn)。

該模型集成了物理模擬、照明效果以及非玩家角色（NPC）行為等高級(jí)功能。

谷歌將自身定位為研究與原型開發(fā)工具，該工具能夠迅速構(gòu)建豐富的環(huán)境，從而使得即便在缺乏專業(yè)訓(xùn)練的情況下，人工智能的評(píng)估工作也變得更加簡便。

科技巨頭紛紛入局世界模型競(jìng)賽

在CES 2025上，黃仁勛宣布推出Cosmos世界模型（Cosmos World Foundation Models，簡稱Cosmos WFMs），該模型專為理解物理世界而設(shè)計(jì)，能夠預(yù)測(cè)并生成具有[物理感知]的視頻內(nèi)容。

除了英偉達(dá)，谷歌以及其他一些初創(chuàng)企業(yè)也在積極追求世界模型的開發(fā)。

李飛飛的World Labs已經(jīng)籌集了2.3億美元資金，用于構(gòu)建[大世界模型]，而Decart和Odyssey等公司也加入了這一領(lǐng)域。

OpenAI先前發(fā)布的Sora模型亦可視為一種[世界模型]，它能夠模擬如畫家在畫布上作畫的行為，以及渲染類似Minecraft的用戶界面和游戲世界。

具體而言，世界模型是通過大量圖像、音頻、視頻和文本數(shù)據(jù)的訓(xùn)練，構(gòu)建出對(duì)世界運(yùn)作方式的內(nèi)部表征，并能夠推理行為的后果。

這使得它們能夠更深入地理解和模擬現(xiàn)實(shí)世界的規(guī)律。

世界模型的概念源自人類大腦形成的心智模型，我們的大腦能夠?qū)⒏泄佾@取的抽象信息整合成對(duì)周圍世界的具體理解，形成[模型]，這些模型幫助我們預(yù)測(cè)和感知世界。

世界模型的特點(diǎn)在于其試圖超越單純的數(shù)據(jù)，模擬人類的潛意識(shí)推理。

例如，棒球擊球手能在極短的時(shí)間內(nèi)決定如何揮棒，是因?yàn)樗麄兡軌虮灸艿仡A(yù)測(cè)球的軌跡。

這種潛意識(shí)推理能力被認(rèn)為是實(shí)現(xiàn)人類級(jí)智能的關(guān)鍵條件之一。

[世界模型]的意義在于能夠?qū)崿F(xiàn)復(fù)雜的推理和規(guī)劃，并將推動(dòng)生成式視頻技術(shù)的發(fā)展。

Meta的首席AI科學(xué)家Yann LeCun認(rèn)為，世界模型未來可能在數(shù)字和物理領(lǐng)域的復(fù)雜預(yù)測(cè)和規(guī)劃中發(fā)揮作用。

例如，給定一個(gè)雜亂無章的房間（初始狀態(tài)）和一個(gè)整潔的房間（目標(biāo)狀態(tài)），世界模型可以推理出一系列清潔行動(dòng)，而不僅僅是根據(jù)觀察到的模式進(jìn)行操作。

具備這些能力后，[世界模型]可廣泛應(yīng)用于影視、游戲、自動(dòng)駕駛以及機(jī)器人等行業(yè)。

結(jié)尾：

未來的世界模型可能能夠按需生成用于游戲、虛擬攝影等用途的3D世界，從而大幅降低開發(fā)成本和時(shí)間。

在過去一年中，人工智能技術(shù)在多個(gè)方向上持續(xù)取得突破，世界模型被視為下一個(gè)重大突破。

盡管距離成熟的[世界模型]還有數(shù)年時(shí)間，但這一技術(shù)已經(jīng)展現(xiàn)出巨大的潛力。

部分資料參考：DeepTech深科技：《谷歌再次調(diào)整AI團(tuán)隊(duì)，諾獎(jiǎng)得主哈薩比斯統(tǒng)領(lǐng)研發(fā)》，量子位：《Sora核心作者掌舵，谷歌世界模型新團(tuán)隊(duì)全球招募》，傳媒1號(hào)：《谷歌DeepMind「世界模型」或成AGI突破口》，AI科技大本營：《Sora前負(fù)責(zé)人帶隊(duì)打造[現(xiàn)實(shí)世界模擬器]，AI領(lǐng)域再掀波瀾》，騰訊科技：《全網(wǎng)熱評(píng)的李飛飛世界生成模型，真的能構(gòu)建物理世界嗎？》，鼓搗AI：《DeepMind發(fā)布世界模型"GPT時(shí)刻"，Genie2或?qū)㈩嵏灿螒虍a(chǎn)業(yè)》，硬AI：《[世界模型]——AI下一個(gè)[必爭之地]，英偉達(dá)、谷歌雙雙下場(chǎng)》

原文標(biāo)題 : AI芯天下丨產(chǎn)業(yè)丨谷歌成立新團(tuán)隊(duì)模擬物理世界AI模型

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫，觀點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

暫無評(píng)論

暫無評(píng)論

圖片新聞

最新發(fā)布

最新活動(dòng)更多

一周熱點(diǎn) 月點(diǎn)擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報(bào)告

人工智能獵頭職位更多

高級(jí)軟件工程師廣東省/深圳市
自動(dòng)化高級(jí)工程師廣東省/深圳市
光器件研發(fā)工程師福建省/福州市
銷售總監(jiān)（光器件）北京市/海淀區(qū)
激光器高級(jí)銷售經(jīng)理上海市/虹口區(qū)
光器件物理工程師北京市/海淀區(qū)
激光研發(fā)工程師北京市/昌平區(qū)
技術(shù)專家廣東省/江門市
封裝工程師北京市/海淀區(qū)
結(jié)構(gòu)工程師廣東省/深圳市

掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯(cuò)

x

_*文字標(biāo)題：

_*糾錯(cuò)內(nèi)容：

聯(lián)系郵箱：

_*驗(yàn) 證碼：

看不清，點(diǎn)擊換一張

粵公網(wǎng)安備 44030502002758號(hào)

感谢您访问我们的网站，您可能还对以下资源感兴趣：

久久人妻av无码中文字幕

m3u8午夜福利一区二区三区久久久精产国品一产二产三产区中文字幕在线一级av片久久精品国产亚洲AV电影网

<b id="lmzvt"></b>