Sora并不驚艷,可靈、混元躺贏
翼言商業(yè)觀察
熱度有多高,吐槽就有多狠。
丨翼言團(tuán)隊
丨全文2490字,閱讀時長約5分鐘
這是一場事先張揚的發(fā)布。
近10個月的等待,和OpenAI CEO山姆·奧特曼的連續(xù)12天的直播預(yù)告,吊足了大家的胃口。
丨用戶過多,Sora新用戶無法注冊
毫無懸念,從第一場直播開始,OpenAI就霸屏科技媒體頭版,直到10日Sora刷屏,這股熱度被推至峰值。全球的用戶蜂擁而至,一度讓OpenAI的服務(wù)器不堪重負(fù),甚至目前還沒有恢復(fù)Sora新用戶注冊。
丨美國社交平臺上部分用戶的吐槽
但是,不同于2月份Sora發(fā)布demo引發(fā)的全球震動,Sora的正式上線引發(fā)了大范圍的吐槽。
細(xì)看下來,翼言發(fā)現(xiàn),這些吐槽從對Sora能力的質(zhì)疑到對OpenAI大肆營銷圈錢的噓聲,甚至還有更尖銳的聲音指出:OpenAI 優(yōu)勢不再。
是OpenAI 雷聲大雨點小,還是網(wǎng)友期望越高失望越大?
Sora并不驚艷,中國模型躺贏
Sora正式上線到底有多火?
不少網(wǎng)友無奈跺腳:我現(xiàn)在想氪金200刀都沒門兒!
2月份Sora發(fā)布的demo引起的震動,很多人應(yīng)該還記憶猶新。隨后,各大AI企業(yè)都在文生視頻領(lǐng)域發(fā)力,發(fā)布產(chǎn)品時無不宣稱“對標(biāo)Sora”。
長達(dá)近10個月的“孕育”后一朝墜地,Sora還是有可圈點之處,不妨先看下OpenAI 官方畫的重點:
現(xiàn)在的Sora性能更好,支持文生視頻、圖生視頻、視頻轉(zhuǎn)視頻,最高1080p,最長20秒視頻時長;
Storyboard功能:可以把一句prompt擴(kuò)展成帶時間線的劇情,并且可以二次編輯;
其他視頻生成小功能,例如兩個視頻融合的Blend功能、替換視頻中的元素的Remix功能、提取視頻關(guān)鍵幀并重新延伸視頻時長的Re-Cut功能、生成循環(huán)視頻內(nèi)容的Loop功能以及風(fēng)格預(yù)設(shè)Style presets等。
盡管OpenAI 給用戶打了預(yù)防針“這個版本的 Sora 會犯錯誤,它并不完美”,但用戶并不買賬。嘗鮮之后,不少用戶紛紛吐槽賣家秀與買家秀之間的巨大差異。
丨@Purz.xyz在X上羅列的Sora槽點
@Purz.xyz在X和Youtube上逐一羅列了槽點,核心就是:效果差,還死貴。丨Youtube大V Marques Brownlee發(fā)布的測試視頻:飛起的犀牛
另一位大V MKBHD相對更全面一些,他認(rèn)為 SORA 在視頻清晰度和地標(biāo)場景生成方面表現(xiàn)出色,而對物理規(guī)律的處理仍然不夠理想,比如物體運動違反常理,或者忽然消失又出現(xiàn)。丨Sora生成的體操依然是“災(zāi)難現(xiàn)場”
不理解物理規(guī)律這一點,依然特別明顯地體現(xiàn)在體操——被視為 AI 視頻的圖靈測試上。
丨@Erik在X上對Sora的點評
Sora的圖生視頻表現(xiàn)也不盡如人意,另一位大V@Erik吐槽:經(jīng)常出現(xiàn)幻覺和莫名其妙的錯誤,逼得你不得不一遍遍重新生成。模型生成的動作往往很快,但這些動作通常顯得很怪異且不連貫。
而且,他還給目前主流的幾款視頻生成應(yīng)用排了個名:
大多數(shù)場景首選 Kling 1.5(國產(chǎn):快手可靈);
動態(tài)鏡頭找 Minimax (MINIMAX 海螺 AI);
視頻轉(zhuǎn)視頻和鏡頭控制用 Runway;
關(guān)鍵幀制作選 Luma;
Sora?也許只適合嘗試一些實驗性的、不可預(yù)期的動作。
是的,你沒看錯,可靈和海螺成了這位海外大V更推薦的優(yōu)選。
而且,不止是他,另一位網(wǎng)友@Bilawal Sidhu還放出了200美元/月的Sora和免費的混元生成的對比視頻,直言:Sora被免費的混元打敗了。
丨@Bilawal Sidhu表示“Sora被混元打敗了”
事實上,自從Sora年初的demo發(fā)布這10個月來,視頻生成賽道的競爭確實早已白熱化。出自中國本土的快手可靈、MINIMAX海螺 AI以及騰訊混元等,已經(jīng)先后在海外圈了一波粉。
丨@Bilawal 美國科技媒體Ars Technica的報道
美國科技媒體Ars Technica 資深 AI記者Benj Edwards也寫道:過去這幾個月里,競爭對手的視頻生成模型“已經(jīng)奪走了 Sora 發(fā)布的光彩”。
無論是因為Sora姍姍來遲,還是因為網(wǎng)友期待太高,預(yù)期的驚艷和驚喜并沒有出現(xiàn),一片吐槽聲中,中國的可靈、海螺 AI以及混元反而躺贏了。
AI生成視頻賽道該怎么卷?
但是,單從Sora發(fā)布兩日來的吐槽,就否定Sora的意義,未免過于武斷。
使用過視頻生成應(yīng)用的一定清楚,AI視頻的連續(xù)性很差,單次生成的基本就是一個畫面、一個意群,能夠承載的信息量有限,距離完整意義的片子還有很遠(yuǎn)。
Sora發(fā)布直播中,OpenAI也明確說道:“如果你認(rèn)為只需點擊一個按鈕就能生成一部故事片,那么你可能對Sora抱有錯誤的期望”。
丨OpenAI發(fā)布Sora前的預(yù)告,畫面精美,想象瑰麗
事實上,國內(nèi)外Sora的競品比如Runway、Luma、可靈、海螺、即夢、Vidu等,也都是各有特色,很難說哪個產(chǎn)品具有絕對的領(lǐng)先優(yōu)勢。
有深度創(chuàng)作用戶評價這幾款工具時表示:從電影制作的角度來,可靈的現(xiàn)實效果最實用,海螺在某些情況下很好,但水平不太一致;Rungway更適合制作大場面,即夢適合做人物,vidu生成的二次元視頻比其他工具要好。
所以,目前,深度創(chuàng)作用戶往往不會只使用一種工具,而是根據(jù)不同的情境選擇不同的工具組合。
也正因如此,翼言認(rèn)為,AI生成視頻賽道的競爭遠(yuǎn)不止于生成畫面這個單一維度,而是在于:
誰更能夠賦能更多普通創(chuàng)作者,在可控性與效果、易得性與門檻、便捷性與工作流上,更好地滿足和服務(wù)創(chuàng)作者,誰才能贏得這場競爭。
而目前,競爭還處于早期階段,技術(shù)還在持續(xù)迭代發(fā)展中。
結(jié) 語
丨OpenAI發(fā)布會直播
OpenAI的系列發(fā)布還在持續(xù),從首日的滿血版o1模型以及ChatGPT Pro版本,到強(qiáng)化微調(diào)(Reinforcement Fine-Tuning)技術(shù),再到Sora和Canavas,熱度一路飆升,口水與爭議齊飛。
距離ChatGPT發(fā)布之日,已經(jīng)兩年了。
兩年間,ChatGPT 逐漸被其他產(chǎn)品追趕甚至超越,光環(huán)漸退;ChatGPT Search沒有激起太大水花;Sora引發(fā)了系列直播以來聲量最大的吐槽;“宮斗”后一年來,包括首席科學(xué)家伊利亞在內(nèi)的大批核心員工離職……OpenAI始終處于媒體的聚光燈和輿論的風(fēng)暴眼中。
同時,傳統(tǒng)巨頭和AI新貴也爭先恐后發(fā)力AI,技術(shù)不斷迭代,產(chǎn)品層出不窮,新的觀點、新的路線、新的嘗試也一直在路上。
日新月異、唯變不變,新和變是這兩年來的關(guān)鍵詞。
既然如此,且不說OpenAI是否優(yōu)勢不再,即使真的不再,那有何妨?誰能一直獨領(lǐng)風(fēng)騷?最重要的是,對更廣大的用戶和市場而言,一個競爭更充分、更百花齊放的AI發(fā)展生態(tài),不是比一枝獨秀、唯我獨美的生態(tài)更健康、更安全嗎?
END
原文標(biāo)題 : Sora并不驚艷,可靈、混元躺贏

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?