123,123

當(dāng)前位置： OFweek 人工智能網(wǎng) > 正文

爭造AI時代剪映：國產(chǎn)Sora的生態(tài)暗戰(zhàn)與商業(yè)黎明

2025-02-18 09:15

內(nèi)容/劉萍

編輯/一白

校對/詠鵝

當(dāng)DeepSeek用1/10算力實現(xiàn)GPT-4級別性能時，這個信號值得所有文生視頻從業(yè)者深思：中國AI創(chuàng)新不應(yīng)趨于技術(shù)復(fù)刻，而是要構(gòu)建原創(chuàng)技術(shù)范式。真正的破局點或在于“場景定義技術(shù)”的創(chuàng)新路徑。當(dāng)技術(shù)研發(fā)深度融入產(chǎn)業(yè)需求時，中國公司完全可能開辟出超越Sora范式的新賽道。正如大模型領(lǐng)域涌現(xiàn)的MoE架構(gòu)創(chuàng)新，文生視頻的下一輪突破，或誕生于技術(shù)與產(chǎn)業(yè)需求的化學(xué)反應(yīng)之中。

今年春節(jié)，DeepSeek火遍全球。上一次大模型引發(fā)如此震動，還是OpenAI發(fā)布Sora時。

2024年2月15日，OpenAI的文生視頻模型Sora橫空出世，憑借其逼真的效果、復(fù)雜的鏡頭轉(zhuǎn)換、以及最長可達1分鐘的視頻生成時長，瞬間在全球引發(fā)熱潮。這一突破也引得國內(nèi)廠商緊急入場，快手可靈、字節(jié)即夢、阿里通義萬相、騰訊混元等文生視頻模型接踵而至，背后亟待開掘的是如剪映般超8億月活和近百億營收的商業(yè)空間。

然而卷了一年后，廠商們依舊是互聯(lián)網(wǎng)時代“小步快跑，試錯迭代”的產(chǎn)品思維。近期快手可靈發(fā)布1.6版本，語義理解、文本響應(yīng)度等功能有所提升，收費規(guī)則沒變；時隔一月，阿里云發(fā)布通義萬相2.1，在大幅度復(fù)雜運動、物理規(guī)律遵循、藝術(shù)表現(xiàn)等層面全面提升，首創(chuàng)生成漢字視頻……

DeepSeek只用少量GPU和低廉的部署成本實現(xiàn)媲美OpenAI效果的解題思路，或許能為文生視頻廠商提供解決困局和改變競爭維度的樣本參考。

如果說2024年，文生視頻廠商完成了從0到1的初步探索，在AIGC技術(shù)日新月異的發(fā)展節(jié)奏與大廠激烈競逐的浪潮中，2025年將背負的是從1到10乃至100的期待。誰將成為引領(lǐng)新一輪文生視頻風(fēng)潮的先鋒？誰又將出現(xiàn)在自家大廠失敗產(chǎn)品的盤點名單之上？

Part.1

技術(shù)路線共識下的創(chuàng)新困境

追趕者難破時長魔咒

當(dāng)OpenAI在2024年2月15日向世界展示Sora時，這個能生成60秒高質(zhì)量視頻的AI模型不僅重新定義了文生視頻的行業(yè)標準，更在無意間為中國AI賽道劃定了技術(shù)追趕的坐標系。

傳統(tǒng)U-Net架構(gòu)需要完整圖像的前后向傳播，而Sora基于Transformer的patch訓(xùn)練機制可將計算成本降低40%以上。這種效率提升讓國內(nèi)廠商在算力受限的環(huán)境下看到了希望——正如DeepSeek用1/3的GPU資源實現(xiàn)GPT-4水平的語言模型，文生視頻領(lǐng)域似乎也存在類似的“捷徑”。

從快手可靈到阿里通義萬相，從字節(jié)即夢到騰訊混元，國內(nèi)廠商集體開啟了一場名為“復(fù)刻Sora”的技術(shù)軍備競賽。

可是，雖然國內(nèi)廠商已掌握Sora的技術(shù)核心DiT架構(gòu)（Diffusion+Transformer）的基礎(chǔ)原理，但這并不意味著他們能順利復(fù)制出國產(chǎn)Sora，關(guān)鍵差距在于技術(shù)體系的完整性。畢竟技術(shù)路線以外，Sora未披露的技術(shù)細節(jié)，諸如參數(shù)規(guī)模、算法設(shè)計等關(guān)鍵技術(shù)環(huán)節(jié)仍存在代際差距。

相比難以突破的算力、算法和數(shù)據(jù)三大核心難關(guān)，國內(nèi)各廠商的主要比拼指標圍繞時長、視頻的分辨率等展開。

而這場始于技術(shù)路線模仿的追逐戰(zhàn)，也在經(jīng)歷近一年的發(fā)展后，逐漸顯露出更深層的創(chuàng)新困境。清華系A(chǔ)I公司瑞萊智慧RealAI、螞蟻集團和百度聯(lián)合孵化的生數(shù)科技，去年4月底就攜文生視頻模型Vidu亮相，號稱能生成最長為16秒的視頻，但7月末正式上線時，視頻時長卻僅有4秒和8秒兩種選擇。

智譜AI在去年7月發(fā)布了文生視頻清影（Ying），底層技術(shù)也沿用了DiT架構(gòu)，可生成的視頻最長僅有6秒，11月增加至10秒。從清華系RealAI的16秒承諾縮水至實際8秒輸出，到智譜AI清影模型從6秒艱難爬升至10秒，國產(chǎn)模型始終困在"秒級"競技場。

即便頭部玩家快手可靈通過"續(xù)寫"功能實現(xiàn)3分鐘拼接視頻，其單次生成仍停留在10秒門檻。這種困境在Sora Turbo正式版發(fā)布后更顯諷刺——OpenAI主動將時長壓縮至20秒，暗示首秀的1分鐘視頻實為精心剪輯之作。

在生成式AI領(lǐng)域，技術(shù)路線的透明度與實現(xiàn)能力之間存在巨大鴻溝，也揭示了一個殘酷現(xiàn)實：單純的技術(shù)路線模仿難以突破物理模擬、時空連續(xù)性等核心難題。就像當(dāng)年國產(chǎn)芯片遭遇的“制程追趕悖論”，文生視頻領(lǐng)域同樣面臨“參數(shù)堆砌效率遞減”的困局。

而當(dāng)整個行業(yè)陷入同質(zhì)化競爭的泥潭時，所謂技術(shù)突破往往淪為參數(shù)調(diào)優(yōu)的數(shù)字游戲。

Part.2

數(shù)據(jù)荒與技術(shù)倫理

構(gòu)建生態(tài)壁壘的雙重挑戰(zhàn)

如果說技術(shù)路線是看得見的戰(zhàn)場，那么數(shù)據(jù)爭奪就是水面下的暗戰(zhàn)。2024年9月愛奇藝起訴MiniMax的版權(quán)糾紛，揭開了大模型訓(xùn)練的暗箱——“數(shù)據(jù)荒”。

算法、算力和數(shù)據(jù)是支撐AI文生視頻模型運行的核心三要素，也是決定技術(shù)突破的基礎(chǔ)。

數(shù)據(jù)是模型訓(xùn)練的原材料，訓(xùn)練數(shù)據(jù)越多，模型越強大。沒有穩(wěn)定的數(shù)據(jù)來源，大模型的訓(xùn)練無從談起。經(jīng)過“百模大戰(zhàn)”，高質(zhì)量數(shù)據(jù)已變得越發(fā)昂貴且稀缺。

強如OpenAI也難逃“數(shù)據(jù)荒”的困境。

2023年，OpenAI因擅自使用媒體數(shù)據(jù)，惹惱了歐美主流媒體，最終拿錢消災(zāi)，與Politico、《時代》、《金融時報》等簽訂了付費協(xié)議。同年5月，OpenAI首席執(zhí)行官奧特曼公開承認，AI公司在不久的將來會耗盡互聯(lián)網(wǎng)上所有的數(shù)據(jù)。

去年8月，OpenAI被超過100位YouTube主播集體訴訟，指控其擅自轉(zhuǎn)錄數(shù)百萬個YouTube 視頻來訓(xùn)練大模型。OpenAI的前任CEO Mira在采訪中被問及是否拿YouTube的視頻訓(xùn)練Sora，Mira拒絕了回答。

當(dāng)互聯(lián)網(wǎng)公開數(shù)據(jù)即將耗盡，擁有私有數(shù)據(jù)池的平臺便擁有了護城河。相信這也是快手、字節(jié)、阿里、騰訊等擁有長短視頻平臺產(chǎn)品的廠商，爭相入局的原因之一。

快手、抖音這樣的短視頻平臺，天然擁有數(shù)據(jù)資源稟賦，多年來積攢了巨量、豐富的視頻數(shù)據(jù)；阿里旗下的優(yōu)酷，為國內(nèi)三大視頻平臺之一，坐擁高質(zhì)量的視頻資源。

谷歌的文生視頻模型Veo2被認為比Sora還強大，暫且不分析復(fù)雜的技術(shù)問題，光是谷歌涌有YouTube，就比OpenAI少了許多數(shù)據(jù)來源煩惱。

當(dāng)技術(shù)水平尚處于統(tǒng)一競爭維度，都未能打破算力、算法和數(shù)據(jù)禁錮，文生視頻賽道的競爭也開始演變?yōu)槠脚_級生態(tài)系統(tǒng)的對抗。

Part.3

商業(yè)化前哨戰(zhàn)

從流量狂歡到價值沉淀的路徑探索

槍戰(zhàn)片版《甄嬛傳》，武打劇類《紅樓夢》，大熊貓做家務(wù)……在快手、抖音、小紅書等社交平臺，這些“魔改”、創(chuàng)意十足的小視頻播放量屢創(chuàng)新高。

雖然創(chuàng)作者已經(jīng)率先分得流量甜頭，但與通用語言大模型的商業(yè)化歷程類似，留給文生視頻的發(fā)育時間注定不會太久。

2025年，文生視頻勢必要經(jīng)歷從技術(shù)崇拜到商業(yè)理性的范式轉(zhuǎn)換。

參考行業(yè)基準線Sora Turbo的訂閱制收費模式，每月20美元可生成50個視頻。具體而言，月收費20美元的ChatGPT Plus用戶可直接使用Sora，但每月最多生成50個480p視頻或更少的720p視頻，時長為5秒。月收費200美元的ChatGPT Pro用戶，能享受更多的視頻生成數(shù)量和更高的分辨率，時長達20秒。

而中國廠商正在積極探索更具本土特色的變現(xiàn)路徑。快手提供免費額度，并設(shè)置了收費梯度，月費分為66元、266元和666元三檔。用戶每次登錄能免費獲得一定數(shù)量的靈感值，消耗完需要開通會員獲取靈感值，才能繼續(xù)生成視頻。

或許是出于促進內(nèi)容生態(tài)繁榮的需求，2024年10月18日，快手可靈啟動了首期“未來合伙人計劃”，推出一站式AIGC生態(tài)合作平臺，幫助創(chuàng)作者降低創(chuàng)作門檻。但這種2C模式面臨雙重挑戰(zhàn)：個人用戶付費意愿天花板明顯，而專業(yè)創(chuàng)作者受制于平臺流量管控策略。

因AI視頻容易引發(fā)版權(quán)糾紛，且若平臺充斥太多AI視頻，會引起用戶反感，進而影響社區(qū)生態(tài)。為此廠商們也在積極探索更多變現(xiàn)路徑以求破局。

抖音和博納合作了AI科幻短劇《三星堆：未來啟示錄》；快手聯(lián)合賈樟柯、李少紅等9位知名導(dǎo)演，依托可靈制作出品9部AIGC電影短片。但具體收益如何還有待考證。

除影視合作外，電商也是B端商業(yè)化的重要試驗田。如阿里面向平臺商家開放專屬圖生視頻，推動營銷落地；可靈將部分內(nèi)測名額給了遙望科技等MCN機構(gòu)，以加速技術(shù)的應(yīng)用與推廣。

這些探索揭示出新的價值邏輯——當(dāng)技術(shù)競賽陷入僵局，場景化落地能力加速賽程推進。

Part.4

行業(yè)終局思考

走出OpenAI的范式“陰影”

DeepSeek用MoE架構(gòu)突破算力瓶頸，文生視頻領(lǐng)域同樣需要架構(gòu)級的變革。

多模態(tài)大模型與神經(jīng)渲染的結(jié)合，量子計算對擴散模型的加速，甚至是腦科學(xué)啟發(fā)的認知架構(gòu)，這些前沿探索雖然風(fēng)險巨大，卻是打破同質(zhì)化競爭的唯一出路。

當(dāng)技術(shù)突破、數(shù)據(jù)生態(tài)與商業(yè)落地形成正向循環(huán)，中國AI企業(yè)才能真正構(gòu)建起自己的護城河。

在這場虛實交織的競賽中，最后的贏家不會是某個技術(shù)參數(shù)的保持者，而是那些能重新定義視頻生成與物理世界關(guān)系的規(guī)則制定者。

正如智能手機革命不僅是通信工具的升級，文生視頻的終極價值，在于創(chuàng)造人類認知與數(shù)字世界交互的新范式。這條路注定漫長，但正是這種超越短期功利的堅持，才能孕育出真正改變世界的創(chuàng)新力量。

原文標題 : 爭造AI時代剪映：國產(chǎn)Sora的生態(tài)暗戰(zhàn)與商業(yè)黎明

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報。

發(fā)表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新發(fā)布

最新活動更多

4日10日
立即報名>> 維科杯· OFweek 2025中國機器人行業(yè)年度評選
4日10日
立即報名>> OFweek 2026（第十五屆）中國機器人產(chǎn)業(yè)大會
精彩回顧
立即查看>> 【線下會議】OFweek 2025（第十屆）物聯(lián)網(wǎng)產(chǎn)業(yè)大會
精彩回顧
立即查看>> 12月16-17日 AMD 嵌入式峰會
精彩回顧
立即查看>> 恩智浦創(chuàng)新技術(shù)峰會
精彩回顧
立即查看>> 【評選】維科杯·OFweek 2025（第十屆）物聯(lián)網(wǎng)行業(yè)年度評選

一周熱點月點擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報告

人工智能獵頭職位更多

高級軟件工程師廣東省/深圳市
自動化高級工程師廣東省/深圳市
光器件研發(fā)工程師福建省/福州市
銷售總監(jiān)（光器件）北京市/海淀區(qū)
激光器高級銷售經(jīng)理上海市/虹口區(qū)
光器件物理工程師北京市/海淀區(qū)
激光研發(fā)工程師北京市/昌平區(qū)
技術(shù)專家廣東省/江門市
封裝工程師北京市/海淀區(qū)
結(jié)構(gòu)工程師廣東省/深圳市

掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯

x

_*文字標題：

_*糾錯內(nèi)容：

聯(lián)系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網(wǎng)安備 44030502002758號

感谢您访问我们的网站，您可能还对以下资源感兴趣：

久久人妻av无码中文字幕

m3u8午夜福利一区二区三区久久久精产国品一产二产三产区中文字幕在线一级av片久久精品国产亚洲AV电影网