OpenAI首席技術(shù)官:Sora或?qū)⒃诮衲晗虼蟊娡瞥,增加生成音頻
OpenAI首席技術(shù)官米拉·穆拉蒂(Mira Murati)在接受采訪時透露,Sora文生視頻工具計劃在今年內(nèi)正式推向公眾。此外,OpenAI還計劃為Sora加入音頻生成功能,進(jìn)一步豐富視頻的場景和情感表達(dá)。
目前,Sora模型已經(jīng)具備輸出60秒視頻的能力,其中包含了高度細(xì)致的背景、復(fù)雜的多角度鏡頭以及富有感情的人物、動物角色,自推出以來引起了業(yè)界和消費者的廣泛關(guān)注,但Sora目前只向測試團(tuán)隊和一部分視覺藝術(shù)家、設(shè)計師和電影制作人開放, 普通人難以體驗Sora文生視頻的魅力。
穆拉蒂透露,目前利用Sora生成視頻的成本過高,這是Sora難以普及的一個重要原因,團(tuán)隊正在優(yōu)化相關(guān)技術(shù),促進(jìn)Sora造福更多人。她還表示,OpenAI計劃加入音頻功能,并允許用戶編輯Sora生成的視頻內(nèi)容,以此來使其生成的視頻更符合要求。
Sora的研究表明,通過擴(kuò)展視頻生成模型是構(gòu)建物理世界通用模擬器的一條極具前景的途徑,對此360創(chuàng)始人周鴻祎曾如此評價:“一旦人工智能接上攝像頭,把所有的電影都看一遍,把YouTube上和TikTok的視頻都看一遍,對世界的理解將遠(yuǎn)遠(yuǎn)超過文字學(xué)習(xí),一幅圖勝過千言萬語,這就離AGI(通用人工智能)真的就不遠(yuǎn)了,不是10年20年的問題,可能一兩年很快就可以實現(xiàn)!
隨著Sora技術(shù)的不斷進(jìn)步和成本的降低,我們有理由相信,不久的將來,這項創(chuàng)新的視頻生成工具將不再是少數(shù)人的專屬,而是成為大眾創(chuàng)作的新寵。至于Sora的公開是否會促進(jìn)通用人工智能的發(fā)展,相信我們很快就可以看到答案。
原文標(biāo)題 : OpenAI首席技術(shù)官:Sora或?qū)⒃诮衲晗虼蟊娡瞥,增加生成音頻

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?