CVPR 2026|“全能AI海報設(shè)計師”PosterOmni開源: 6大任務(wù)笑傲開源社區(qū),媲美閉源商用
作者:Sixiang Chen等 解讀:AI生成未來 很多AI 海報生成默認從一句 prompt 出發(fā)(Text-to-Poster)。但在真實設(shè)計流程里,更常見的起點其實是一張參考圖/舊海報/產(chǎn)品主
NeurIPS`25 | 清華提出模型驅(qū)動的生成式探索機制MoGE,助力強化學(xué)習(xí)算法突破性能上限
作者:Likun Wang等 解讀:AI生成未來 本文介紹清華大學(xué)李升波教授課題組(iDLab)在NeurIPS 2025發(fā)表的《Off-policy Reinforcement Learning w
顛覆性突破!何愷明團隊重磅工作「Drifting Models」革新生成范式:一步推理直接創(chuàng)紀(jì)錄
作者:Mingyang Deng等 解讀:AI生成未來 亮點直擊 全新的生成范式:提出了“漂移模型” (Drifting Models),這一范式不再依賴于推理時的迭代過程,而是將分布演化的過程轉(zhuǎn)移到
一張圖生成游戲?谷歌Genie體驗:萬物皆可玩,但離“殺死游戲公司”還遠
一張圖生成游戲,真的假的? 在開始之前,我想先問大家一個簡單的問題: 你們還在苦苦等待《GTA 6》的發(fā)售嗎? 我是不清楚大家的想法啦,但小雷真的非常期待它的到來。要知道《GTA 5》發(fā)布至今已經(jīng)過去
視頻理解大模型覺醒!Video-o3發(fā)布:像偵探一樣主動搜尋關(guān)鍵幀,登頂Video-Holmes!
作者:Xiangyu Zeng等 解讀:AI生成未來 亮點直擊 Video-o3,一個創(chuàng)新的框架,它通過迭代地發(fā)現(xiàn)顯著的視覺線索、對關(guān)鍵片段進行細致檢查以及在收集到足夠證據(jù)時自適應(yīng)終止搜索過程,解決了
Google“AI奧運會”:用游戲基準(zhǔn)測試模型真實能力
AI新產(chǎn)品每天接連發(fā)布,測試基準(zhǔn)和平臺也是層出不窮。 不過,你是否想過,游戲也能用來測試AI? 2026年2月初,Google和Kaggle一起想出了一個新點子:在Kaggle的Game Arena上
擴散模型迎來“終極簡化”!何愷明團隊新作:像素級一步生成,速度質(zhì)量雙巔峰
作者:Yiyang Lu等 解讀:AI生成未來 亮點直擊 Pixel MeanFlow (pMF)?,這是一種針對一步生成(one-step generation)的創(chuàng)新圖像生成模型。pMF 的核心突
擴散模型對齊迎來“最強解”!HyperAlign屠榜評測:超網(wǎng)絡(luò)動態(tài)適配,畫質(zhì)、語義雙巔峰
作者:Xin Xie等 解讀:AI生成未來 亮點直擊 HyperAlign,一種通過超網(wǎng)絡(luò)自適應(yīng)調(diào)整去噪操作的框架,能夠高效且有效地實現(xiàn)擴散模型的測試時對齊,確保生成的圖像更好地反映用戶意圖的文本語義
一統(tǒng)視覺江湖!OpenVision 3發(fā)布:一個編碼器實現(xiàn)理解與生成完美統(tǒng)一,性能雙殺CLIP
作者:Letian Zhang等 解讀:AI生成未來 亮點直擊 統(tǒng)一架構(gòu):OpenVision 3是一種先進的視覺編碼器,能夠?qū)W習(xí)單一、統(tǒng)一的視覺表示,同時服務(wù)于圖像理解和圖像生成任務(wù)。 簡潔設(shè)計:核
告別時空崩壞,生成式游戲迎來“穩(wěn)態(tài)”時刻!南大等StableWorld:打造無限續(xù)航虛擬世界
作者:Ying Yang等 解讀:AI生成未來 亮點直擊 識別了長時交互式世界建模中不穩(wěn)定性的根本原因:同一場景內(nèi)的微小漂移會不斷累積,最終導(dǎo)致整體場景崩潰。 一種簡單而有效的方法?StableWor
角色動畫最新SOTA!港大&螞蟻等CoDance:解綁-重綁實現(xiàn)任意數(shù)量、位置角色同屏起舞
作者:Shuai Tan等 解讀:AI生成未來 圖1。由CoDance生成的多主體動畫。給定一個(可能錯位的)驅(qū)動姿勢序列和一張多主體參考圖像,CoDance生成協(xié)調(diào)且可姿勢控制的群舞,無需每個主體的
視頻生成效率革命!英偉達TMD蒸餾框架:Wan2.1模型實時化,速度和質(zhì)量最佳均衡!
作者:Weili Nie等 解讀:AI生成未來 亮點直擊 一種新穎的視頻擴散蒸餾框架:?轉(zhuǎn)移匹配蒸餾(TMD),它將長去噪軌跡蒸餾成緊湊的少步概率轉(zhuǎn)移過程。 解耦的擴散主干設(shè)計:?將教師模型分解為語義
Qwen3-VL-Flash提升13.62%!浙大等首創(chuàng)CoV:多步推理具身問答Agent,通用提點神器
作者:CoV團隊 解讀:AI生成未來 亮點直擊 CoV 框架:首創(chuàng)“視鏈提示”(Chain-of-View, CoV),一個免訓(xùn)練、測試時(test-time)的具身問答智能體框架。 主動視覺推理:將
自回歸最新SOTA!百度VideoAR:首個視頻VAR框架,推理步數(shù)減少10倍,比肩擴散模型
作者:Longbin Ji等 解讀:AI生成未來 圖1 VideoAR通過文本提示生成高保真且時間一致的視頻 亮點直擊 首個視頻 VAR 框架:?VideoAR,首個將視覺自回歸建模應(yīng)用于視頻生成的大
國產(chǎn)多模態(tài)搜索史詩級突破!Qwen3-VL登頂MMEB:支持30+語言,一套模型搞定圖文視頻
作者:Mingxin Li等 解讀:AI生成未來 亮點直擊 推出了基于 Qwen3-VL 基礎(chǔ)模型的?Qwen3-VL-Embedding?和?Qwen3-VL-Reranker?系列模型。 一套端到
硬剛谷歌Veo3!快手Klear統(tǒng)一多任務(wù)音視頻聯(lián)合生成:創(chuàng)新單塔架構(gòu),口型語音完美同步
作者:Jun Wang、Chunyu Qiang等 解讀:AI生成未來 亮點直擊 Klear 框架:提出了一個統(tǒng)一的音頻-視頻生成框架,能夠同時處理聯(lián)合生成(Joint Generation)和單模態(tài)
強勢斬獲6項SOTA!UniCorn打通理解與生成任督二脈,靠“內(nèi)省”重構(gòu)多模態(tài)認知
作者:Ruiyan Han等 解讀:AI生成未來 亮點直擊 傳導(dǎo)性失語癥:將統(tǒng)一多模態(tài)模型中“理解能力強但生成能力弱”的現(xiàn)象形式化為“傳導(dǎo)性失語癥”。 UniCorn 框架:一種無需外部數(shù)據(jù)或教師監(jiān)督
一個人就是一支整編劇組!首個“統(tǒng)一導(dǎo)演”模型發(fā)布:字節(jié)UniMAGE,讓腦洞原地變大片
作者:Jiaxu Zhang等 解讀:AI生成未來 亮點直擊 概念:UniMAGE體現(xiàn)了“統(tǒng)一導(dǎo)演模型” 的概念,整體協(xié)調(diào)敘事邏輯和視覺構(gòu)圖,將用戶意圖與多模態(tài)劇本聯(lián)系起來,實現(xiàn)創(chuàng)意音視頻生成。 技術(shù)
全棧視覺生成器殺到!上交&快手&南洋理工最新VINO:圖像視頻生成+編輯一網(wǎng)打盡
作者:Junyi Chen等 解讀:AI生成未來 亮點直擊 統(tǒng)一視覺生成框架VINO:一個將圖像/視頻生成與編輯任務(wù)統(tǒng)一在單一框架下的模型,無需針對特定任務(wù)設(shè)計獨立模塊。 交錯全模態(tài)上下文:通過耦合視
復(fù)刻“黑客帝國”子彈時間!SpaceTimePilot:視頻變可操控4D游戲,倒放/變速/運鏡隨你掌控
作者:Zhening Huang等 解讀:AI生成未來 亮點直擊 首次實現(xiàn)了聯(lián)合空間和時間控制的視頻擴散模型:?SpaceTimePilot 是首個能夠從單個單目視頻實現(xiàn)對動態(tài)場景進行聯(lián)合空間(攝像機
資訊訂閱
- 110倍于騰訊,關(guān)鍵剛剛開始,堪稱史無前例的機會
- 2分析丨硅谷軟件巨頭蒸發(fā)3000億,AI要徹底顛覆SaaS?
- 3OpenClaw:一個被“Vibe”捧紅,又被“體驗”打回原形的實驗品 | 人人能懂的產(chǎn)業(yè)報告
- 4字節(jié)、阿里、百度AI云大戰(zhàn)全記錄:一場面向未來的投資
- 5扎心了,真相殘酷,AI留存率僅12.8%
- 6奇瑞需要一場“尹同躍式AI大躍進”
- 7萬億外貿(mào)市場,為何成了AI應(yīng)用富礦
- 8開年特稿|2026,普通人最應(yīng)該把握的十大資本趨勢
- 9CVPR 2026|“全能AI海報設(shè)計師”PosterOmni開源: 6大任務(wù)笑傲開源社區(qū),媲美閉源商用
- 10特斯拉Cybercab下線,無人駕駛還會遠嗎?
-
加密芯片筑牢工業(yè)設(shè)備防抄板防線2025-11-14
-
LKT4202UGM、LKT4305GM國密芯片2025-10-31
-
金融級安全加密芯片-LKT43042025-04-10
-
ATSHA204A國產(chǎn)全兼容芯片LCSHA2042025-02-27
-
耗材保護芯片-LKT4304解決方案2025-02-13
-
LKT4304新一代算法移植加密芯片2025-01-16

