訂閱
糾錯(cuò)
加入自媒體

虛擬人的發(fā)展簡(jiǎn)史與三條路線

作者|Tim Jiang

編輯|Tim Jiang

01

虛擬人發(fā)展簡(jiǎn)史

什么是虛擬人?結(jié)合行業(yè)里的定義以及個(gè)人理解,虛擬人主要是通過計(jì)算計(jì)算圖形學(xué)、圖形渲染、動(dòng)作捕捉、深度學(xué)習(xí)和語(yǔ)音合成等計(jì)算機(jī)手段制作出來(lái)的具有人類多重特征的虛構(gòu)人物。

來(lái)源:公開網(wǎng)絡(luò),Max Headroom;

虛擬數(shù)字人的歷史敘述可以追溯到上世紀(jì) 80 年代在英國(guó)出現(xiàn)的虛擬數(shù)字主持人—— Max Headroom,其內(nèi)容制作的背后由演員 Matt Frewer 飾演,并在當(dāng)時(shí)被宣傳為“第一位計(jì)算機(jī)生成的電視節(jié)目主持人”;然而,實(shí)際上 Max Headroom 并不是由計(jì)算機(jī)生成,而是由演員 Matt Frewer 戴著假肢并穿著西裝,在特定的拍攝環(huán)境下刻意呈現(xiàn)的。

隨著個(gè)人計(jì)算機(jī)的普及與技術(shù)應(yīng)用,從上世紀(jì) 80 年代開始,通過 CG(Computer Graphics)制作的影視內(nèi)容不斷出現(xiàn),期間包括 1973 年的《Westworld》、1977 年的《星球大戰(zhàn)》以及 1979 年的《異形》;到了1991 年,類似《終結(jié)者 2 》中完全由 CG 制作的角色——終結(jié)者“T-1000”開始出現(xiàn);1995 年,由皮克斯制作的《玩具總動(dòng)員》成為第一部完全通過 CG 技術(shù)制作的電影。

來(lái)源:公開網(wǎng)絡(luò),《星球大戰(zhàn)》;

CG 技術(shù)的出現(xiàn)與普及,主要是為了提高更早以前的傳統(tǒng)動(dòng)畫行業(yè)內(nèi)容制作效率,并讓動(dòng)畫制作繞開了在紙張上著墨的環(huán)節(jié);成本上看,制作周期更短更快、人員成本更少以及更加環(huán)保,并且在收入上更加可觀,例如皮克斯于 1999 年推出的《玩具總動(dòng)員 2 》,當(dāng)時(shí)在全球拿下了 4.85 億美元票房。

來(lái)源:公開網(wǎng)絡(luò), Cabell Calloway III;

動(dòng)作捕捉(Motion Capture,下稱“動(dòng)捕”)其實(shí)最早可以追溯到上世紀(jì) 30 年代的美國(guó)爵士歌手 Cabell Calloway III,他的舞蹈動(dòng)作與風(fēng)格被融入了動(dòng)畫制作當(dāng)中,內(nèi)容制作方通過將演員跳舞中的動(dòng)作記錄下來(lái),以便藝術(shù)家可以在鏡頭上勾勒出逼真的動(dòng)畫動(dòng)作,以及迪士尼的早期作品《白雪公主和七個(gè)小矮人》也是如此。

進(jìn)入到 21 世紀(jì),結(jié)合 CG和動(dòng)作捕捉(Motion Capture,下稱“動(dòng)捕”)兩項(xiàng)技術(shù)制作的虛構(gòu)人物開始在電影中大放異彩,例如 2001 年上線的《指環(huán)王》中的“咕!边@一角色,以及后來(lái)陸續(xù)出現(xiàn)的《阿凡達(dá)》、《猩球崛起》以及漫威《復(fù)仇者聯(lián)盟》系列中的“滅霸”。

來(lái)源:公開網(wǎng)絡(luò),滅霸拍攝過程;

21 世紀(jì)的前十年除了計(jì)算機(jī)在視覺制作上進(jìn)步,同時(shí)間線在音樂制作領(lǐng)域也出現(xiàn)了一個(gè)代表性的事件,即在 2007 年推出的“初音未來(lái)”,她是 Crypton Future Media(下稱“Crypton”) 旗下通過雅馬哈旗下 Vocaloid 2 語(yǔ)音合成引擎開發(fā)的虛擬女性歌手,即將聲優(yōu)的錄音合成歌聲,需要輸入部分諸如音調(diào)、歌詞和音速等情感參數(shù)。

來(lái)源:公開網(wǎng)絡(luò),初音未來(lái)演唱會(huì);

原先在 Crypton 負(fù)責(zé)初音項(xiàng)目的僅 3~4 人,早期團(tuán)隊(duì)曾想接洽歌手來(lái)提供聲音,但接洽下來(lái)的歌手基于聲音的復(fù)制與版權(quán)問題而拒絕了合作,最后在篩選了 500 位聲優(yōu)后選擇了聲優(yōu)藤田咲來(lái)提供原聲,總錄制時(shí)間達(dá)到 6 小時(shí);另一方面,在初音的 IP 設(shè)定上, Crypton 將其定位為年齡 16歲、生日為2007 年 8 月 13 日、身高 158 cm 以及體重 42 kg 的少女歌手,擅長(zhǎng)流行歌曲、搖滾樂與舞蹈,隨著初音 IP 知名度的提高,項(xiàng)目方開始向漫畫、游戲、電視節(jié)目、演唱會(huì)以及更多周邊生態(tài)進(jìn)行商業(yè)化。

進(jìn)入到 2011 年,剛剛講的  Vocaloid 語(yǔ)音合成引擎已經(jīng)迭代到第 3 個(gè)版本了,雅馬哈與國(guó)內(nèi)名為 Bplats 的公司合作, Bplats 可能很多人也沒聽說過,但它旗下有家子公司名為“上海禾念”,相信很多人聽過。

來(lái)源:公開網(wǎng)絡(luò),洛天依;

回到 Vocaloid,雅馬哈和 Bplats 開始在 2011 年一起推進(jìn)“ Vocaloid China ”項(xiàng)目,同年公布征集了人物形象與活動(dòng)計(jì)劃,最后成功入圍了 5 件作品,大家熟知的“洛天依”就是其中之一;到了 2014 年,Bplats 在官網(wǎng)宣布了 “Vocaloid China” 項(xiàng)目的運(yùn)營(yíng),包括洛天依在內(nèi)的 5 個(gè)IP 劃歸為脫離母公司的上海禾念所有,禾念同時(shí)在 2015 年推出了虛擬藝人品牌 Vsinger,在后幾年發(fā)展中被 Bilibili 收購(gòu)成為旗下超電文化的子公司。

2018 年,洛天依的歌聲庫(kù)已經(jīng)擴(kuò)展到了 Vocaloid 5 、ACE AI 歌聲庫(kù)以及微軟小冰歌聲庫(kù),不同于 Vocaloid 基于組合拼接的合成方式,后兩者則基于 AI 生成。

來(lái)源:公開網(wǎng)絡(luò),小冰;

小冰是微軟亞研院在 2014 年在中國(guó)推出的 AI 聊天機(jī)器人,2016 年其在全球已經(jīng)覆蓋 40 多個(gè)平臺(tái)以及合計(jì) 6.6億的用戶使用;2020 年小冰業(yè)務(wù)從微軟拆分成為獨(dú)立運(yùn)營(yíng)的小冰公司。

02

虛擬人的商業(yè)路線

關(guān)于虛擬人的劃分,最簡(jiǎn)單的方式是判斷虛擬人的是不是依靠人的,即依靠人和依靠機(jī)器的。

所謂依靠人的,即通過動(dòng)態(tài)捕捉技術(shù)來(lái)進(jìn)行肢體與表情的交互,目前常見的動(dòng)作捕捉技術(shù)可分為 3 種:光學(xué)動(dòng)捕、慣性動(dòng)捕和計(jì)算機(jī)視覺動(dòng)捕。

隨著計(jì)算機(jī)圖像識(shí)別相關(guān)算法的進(jìn)步,通過慣性動(dòng)捕或者光學(xué)動(dòng)捕將不再是這一類的必須工具,比如 iPhone 中的「擬我表情」,通過 iPhone 的前置攝像頭捕捉我們的面部肌肉和動(dòng)作,再通過手機(jī)的神經(jīng)網(wǎng)絡(luò)引擎機(jī)器學(xué)習(xí)計(jì)算獲得,本質(zhì)上所有的語(yǔ)言、語(yǔ)音、表情與肢體互動(dòng)還是依靠人來(lái)提供。

所謂依靠機(jī)器,虛擬人呈現(xiàn)的內(nèi)容在語(yǔ)言、語(yǔ)音、表情與肢體互動(dòng)上通過計(jì)算機(jī)的 AI 模型來(lái)運(yùn)算得出,可以是離線生成也可以是實(shí)時(shí)驅(qū)動(dòng),離線就是異步的,實(shí)時(shí)就是動(dòng)態(tài)同步的。

再進(jìn)一步,虛擬人相關(guān)內(nèi)容的生產(chǎn)主要涉及到三個(gè)環(huán)節(jié):建模、驅(qū)動(dòng)和渲染,每個(gè)環(huán)節(jié)依靠人還是依靠機(jī)器,以及依靠程度的高低,不同的組合造就了現(xiàn)在市場(chǎng)上不同的虛擬人流派。

小冰的CEO 李笛把目前市場(chǎng)上三種主要的虛擬人流派描述為殊途同歸,大白話講就是當(dāng)前所謂的虛擬人賽道上,三撥不同人馬在往里湊,干內(nèi)容特效的,干偶像運(yùn)營(yíng)的和干人工智能的。

2.1 內(nèi)容特效路線

可以追溯到上節(jié)提到的歷史背景,從動(dòng)畫行業(yè)再到影視 CG 特效,呈現(xiàn)的內(nèi)容目前不具備實(shí)時(shí)互動(dòng)的能力,都是提前生產(chǎn)的,中間部分是通過設(shè)計(jì)師和藝術(shù)家繪制建模與渲染而成,部分是半人工或機(jī)器生成,比如《速度與激情 7 》中已故演員保羅沃克的戲份就是通過替身和計(jì)算機(jī)合成。

走影視行業(yè)路線,其商業(yè)模式本質(zhì)是內(nèi)容付費(fèi),因此這類項(xiàng)目方對(duì)于內(nèi)容的精細(xì)度與現(xiàn)實(shí)程度有很高要求,對(duì)立面則是隨之而來(lái)的內(nèi)容制作成本會(huì)很高,根據(jù)相關(guān)媒體報(bào)道,這類作品的成本達(dá)到每秒 8000~15000元不等。

來(lái)源:鳳凰網(wǎng),柳夜熙;

走明星網(wǎng)紅路線,其商業(yè)模式本質(zhì)是廣告變現(xiàn),特點(diǎn)是這類人物內(nèi)容更多以靜態(tài) 3D 為主,然后通過品牌代言創(chuàng)造營(yíng)收,國(guó)內(nèi)虛擬網(wǎng)紅 IP 案例如柳夜熙、AYAYI 以及翎;在人力成本上,以柳夜熙為例,其背后就包括了一個(gè) 150 人的團(tuán)隊(duì)。

2.2 偶像運(yùn)營(yíng)路線

偶像運(yùn)營(yíng)路線背后主要是做 IP 孵化和 MCN 運(yùn)營(yíng)的機(jī)構(gòu),偶像人設(shè)不強(qiáng)調(diào)互動(dòng),人物的驅(qū)動(dòng)主要依靠背后演員的聲音與動(dòng)作(PS:這種模式也被稱為“中之人”);另一方面在渲染上能夠降低成本,多以二次元畫風(fēng)呈現(xiàn),也能夠提高 IP 塑造與風(fēng)險(xiǎn)控制,因此這類路線更加偏重運(yùn)營(yíng),例如被字節(jié)跳動(dòng)收購(gòu)的 A-Soul 就屬于這個(gè)路線,2021 年 A-Soul 團(tuán)隊(duì)直播年?duì)I收達(dá)到 2500 萬(wàn)元。

來(lái)源:公開網(wǎng)絡(luò),Asoul;

相比于孵化真人網(wǎng)紅,可以避免出現(xiàn) MCN 機(jī)構(gòu)與網(wǎng)紅之間的不可控因素,但在 IP 的管理上仍然是以傳統(tǒng)的模式,一方面虛擬網(wǎng)紅與背后的演員和聲優(yōu)是掛鉤的,因此無(wú)法達(dá)到規(guī);趸,這也是為什么沒有見到成批的洛天依和初音未來(lái)。

2.3 人工智能路線

人工智能的路線直接跳過了通過人工驅(qū)動(dòng)虛擬人進(jìn)行互動(dòng),對(duì)于表情、肢體、語(yǔ)言和語(yǔ)音等多模態(tài)融合的技術(shù)要求高,按照小冰 CEO 李笛的說法,前兩者路線,第一種人力生產(chǎn)成本高昂,內(nèi)容生產(chǎn)與優(yōu)化周期長(zhǎng),第一種仍然與人掛鉤無(wú)法規(guī);冶澈笠廊皇且匀藶楹诵,偽人工智能。

針對(duì)前兩者沒有解決的問題,小冰希望通過機(jī)器路線打造 AI 驅(qū)動(dòng)的虛擬人。目前,小冰的制作不同于影視領(lǐng)域的人工動(dòng)態(tài)捕捉建模與畫面渲染,而是通過機(jī)器學(xué)習(xí)生成,渲染成本控制在 17 元/秒,大約是傳統(tǒng)影視制作的 1/500,缺點(diǎn)是畫面的精度只有 1080 P,無(wú)法和前者相比,但在手機(jī)上呈現(xiàn)是足夠了。

同時(shí)在人員上,小冰的建模渲染由于是通過計(jì)算機(jī)生成的,因此沒有專門的美術(shù)相關(guān)人員,出圖效率可以做到以萬(wàn)計(jì)算,而內(nèi)容的好壞交給市場(chǎng)與用戶去評(píng)判,再根據(jù)用戶偏好矯正與迭代。

來(lái)源:小冰;

另一種基于 AI 的虛擬人場(chǎng)景主要是企業(yè)服務(wù)領(lǐng)域,例如 RPA 辦公流程自動(dòng)化,萬(wàn)科的財(cái)務(wù)部虛擬員工崔筱盼,以及近期紅杉推出的虛擬員工 Hóng ,在近期的宣傳視頻中的 IP 形象依然是提到的第一種路線,通過頭像設(shè)計(jì)與拍攝后期合成。

來(lái)源:紅杉;


封面:公開網(wǎng)絡(luò)

       原文標(biāo)題 : 虛擬人的發(fā)展簡(jiǎn)史與三條路線

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)