虛擬人可以復制,但如何賦予虛擬人不一樣的“靈魂”?
摘要
虛擬人是以數字形式存在的,具有人的外觀、特點、行為,依賴科技展示的虛擬形象。虛擬人作為元宇宙重要的賽道,能夠為元宇宙帶來豐富的內容和沈浸式的體驗。虛擬人可以復制,但如何賦予虛擬人不一樣的“靈魂”?我們從產業發展邏輯說起——
基於內容產生和用途的虛擬人四象限分類。我們從創作運營與應用場景兩個維度,可以將虛擬人分為四種分類:服務型虛擬人(PGC+功能型)、虛擬偶像(PGC+IP價值)、數字化身(UGC+功能型)、創作載體(UGC+IP價值)。四類的虛擬人在製作上技術相通,但應用上有完全不同的發展路徑。
政策:公共傳媒場景成為服務型虛擬人發展突破點。 10 月22 日,《廣播電視和網絡視聽” 十四五” 科技發展規劃》指出,推動虛擬主播、動畫手語廣泛應用於新聞播報、天氣預報、綜藝科教等節目,創新節目形態。傳媒場景的服務型虛擬人由此加速嘗試,例如新華社虛擬記者小諍和央視新聞引入的首位AI手語主播,公眾對虛擬人的接受程度不斷提升。
技術:AI助力降低門檻,邊緣算力價值凸顯。虛擬人在機器學習、計算機視覺等技術加持下,於面部形象、動作展示、聲音識別與合成等維度越來越呈現精細化態勢,體現其未來高精度的特質。同時,隨著AI算法的發展以及製作平台的出現,虛擬人的製作門檻也在不斷降低,成為C端可以企及的應用。市場看到虛擬人本身,而忽略了背後的IT支撐,靜態展示的虛擬人只需要通過建模和渲染技術,就能可輸出堪比真人的超寫實圖像。而動態展示需要在建模的基礎上,加上動畫製作和語音,需要動作捕捉及渲染技術。交互型的虛擬人對邊緣算力需求極大,將催生新的IT需求。
商業模式:虛擬偶像先行,UGC星辰大海。虛擬偶像以虛擬主播Vtuber形式為主,主要原因在於門檻低、變現相對容易和迅速。 B站的虛擬主播數量穩步上升,頭部單月營收高達200萬元,未來自媒體平台有望出現各大垂直領域虛擬偶像,而我們認為真正賦予虛擬人靈魂的在UGC創作。
DAO:賦予虛擬人靈魂的社區創作模式。著名的“初音未來”是社區運營、自主生成內容機制的典型案例,有大量的創作者將自己的音樂以“初音未來”的化身展現,但因缺乏商業模式目前面臨著創作者流失的困境。而依靠UGC社區創作的虛擬偶像生態,在Web3.0下能夠與DAO結合產生新的商業運營模式,參與者共享IP成長紅利。
投資建議:推薦關注虛擬人製作以及IP運營。 1)虛擬人製作:英偉達、騰訊、Unity、科大訊飛、捷成股份、鋒尚文化;2)虛擬人運營(傳媒覆蓋):芒果超媒、藍色光標、星期六、浙文互聯、奧飛娛樂;3)虛擬人算力:美國像素、中興通訊、新易盛、中際旭創、廣和通、美格智能等。
風險提示:技術創新不及預期;區塊鏈政策監管風險;區塊鏈基礎設施開發不達預期。
前言
在聚焦元宇宙大賽道時,虛擬人作為重要的交互載體被市場所重視,過去幾年隨著建模技術的提升,虛擬人的生產製造日趨成熟,但作為數字世界的“人”,它只是一個動漫形象嗎?如何讓虛擬人具備不一樣的“靈魂”?本文,我們將結合元宇宙、UGC與DAO,探討虛擬人行業未來發展之路。
虛擬人現狀:公司與社區共創作,功能與IP價值齊發展
近期虛擬人的熱度不斷提升,10月31日,虛擬人柳夜熙在抖音橫空出世,一夜漲粉百萬。柳夜熙並不是第一個虛擬人,清華大學的華智冰、抖音紅人阿喜,變裝女神集原美,在各大社交平台上都擁有一批的粉絲喜愛和追捧。全國有近4億人關注過虛擬偶像,去年虛擬偶像市場達到2000億,兩年時間翻了一倍。在2021英偉達GTC大會上,黃仁勳重點介紹了虛擬分身(avatar)Toy-me和虛擬人,對答如流令人印象深刻。
什麼是虛擬人?虛擬人是以數字形式存在的,具有人的外觀、特點、行為,依賴顯示設備展示的虛擬形象。簡單來說,虛擬人就是讓用戶感覺到人格的數字形象。當下,虛擬人可以扮演多種角色,包括虛擬主播、虛擬偶像、虛擬記者、虛擬助手等等。
虛擬人是元宇宙重要的賽道,能夠為元宇宙帶來豐富的內容和沈浸式的體驗。
虛擬人的創作運營主要依靠專業團隊商業化運作,以及愛好者社區的UGC內容;而在虛擬人的應用場景方面主要是強調功能與IP價值。我們從創作運營與應用場景兩個維度,可以將虛擬人作以下四種分類:服務型虛擬人(PGC+功能型)、虛擬偶像(PGC+IP價值)、數字化身(UGC+功能型)、創作載體(UGC+IP價值)。四種類別的虛擬人的應用上有著完全不同的發展路徑,製作上共用相關技術但略有差異。
服務型虛擬人為用戶提供擬人化的社會服務。相較於聊天機器人、數字助理和數字人,服務型虛擬人的優勢在於高精度建模與人工智能使得其能更大範圍地承接社會工作。從影視到金融再到遊戲,虛擬人可以承擔多種服務型角色,為用戶提供智能高效的人性化服務。新華社的虛擬記者、央視的虛擬手語師都屬於此列,這些工作需要人的形象,成為了服務型虛擬人很好的落地場景。
虛擬偶像是通過科技手段展現的虛擬形象,有著自己的人設。虛擬偶像也可以舉辦的演唱會、直播,發行周邊產品,參與商品代言,甚至參與影視劇中扮演角色。虛擬偶像由公司運營IP,專業化團隊生產內容。例如2016年日本虛擬偶像“絆愛”誕生,主創團隊賦予其“人工智障”的呆萌人設,4個月內粉絲量達40萬,主要在視頻平台發布作品,這類“Vtuber”開始興起。
服務型虛擬人和虛擬偶像類都是依靠專業團隊製作、運營,更好的增強平台和用戶間的交互,近年來MCN的崛起使此類虛擬人有更多的變現通道和商業模式,成為新媒體、抖音等“新寵”。整體而言,此類虛擬人基於PGC,製作精良但生態相對封閉,製作和運營的過程通過自有團隊或外包完成,虛擬人的“靈魂”由主辦方定義、製作平台打造。
虛擬化身(Avatar)從遊戲“捏臉”發展而來,給用戶帶來高度沉浸。滿足用戶個性化需求的“捏臉”遊戲起源於單機遊戲《上古捲軸3》,現已廣泛應用於各類游戲種。在其漫漫發展歷程中,“捏臉”系統可調參數據類型得到極大豐富,複雜程度也隨著算法的精進而逐步提升。未來虛擬化身Avatar除了在遊戲應用得風生水起,還能促進社交活動網絡化。虛擬化身能夠增強用戶代入感,同時能夠滿足虛擬應用場景。
作為社區創作載體,這類虛擬人的形象和表達都不是固定的。最為熟知的創作載體“初音未來”是Crypton公司在語音合成引擎VOCALOID上出售的聲源,並附帶擬人化形象。由於該聲源有著美妙的人聲合成音,以及Crypton公司開放版權使用權,初音未來的社區創作十分活躍,湧現了大量高質量的社區作品,並在2009年舉辦了世界第一場全息影像的虛擬偶像演唱會。在中國後來也引入了“洛天依”,創作者通過購置“洛天依”的聲源來讓洛天依演唱自己喜歡的歌曲。
虛擬人生產:PGC與UGC並進;超寫實與低門檻雙線發展
虛擬人賽道的興起並非一時,經過數十年的技術積累,其應用場景在不斷拓寬。早在20世紀80年代,創作者就開始嘗試打造具有人格的數字形象。但由於技術限制,當時的數字人以2D手工繪製為主,應用非常有限。而在21世紀初,CG(電腦生成動畫)、動作捕捉、人聲合成等技術逐步成熟,虛擬人開始快速發展,CG技術產生的數字虛擬人在電影中普遍運用。而在最近5年,得益於人工智能技術的突破,虛擬人的製作得以簡化、可交互性更強,進入了發展的快車道。當前更是在建模的精細度、動作捕捉和AI交互不斷提升,虛擬人以達到寫實級逼真程度,且具備情感表達和溝通交流的能力。
虛擬人的製作不斷精細化的同時,製作門檻也在不斷降低。在技術革命的推波助瀾之下,虛擬人在機器學習、深度學習、計算機視覺等技術加持下,於面部形象、動作展示、聲音識別與合成等維度越來越呈現精細化態勢,體現其未來高精度的特質。同時,隨著AI算法的發展以及製作平台的出現,虛擬人的製作門檻也在不斷降低。靜態展示的虛擬人只需要通過建模和渲染技術,就能夠數除堪比真人的超寫實圖像。而動態展示需要在建模的基礎上,加上動畫製作和語音,這往往需要動作捕捉技術。交互型的虛擬人需要人工智能技術對用戶反饋進行識別交互。
1.虛擬人製作——算力為王,邊緣崛起
目前虛擬人設計的主流方式是掃描建模。其可分為靜態重建和動態光場重建兩類技術,其中靜態掃描仍處於主流地位,而高保真動態光場三維重建技術初露鋒芒。未來動態光場重建技術將進一步應用於靜態虛擬人的製作,提升虛擬人的光影效果與用戶視覺感官,由於技術的易得性,未來動態光場重建技術的使用門檻將逐步降低,達到普及態勢。
平台化工具支持低門檻創作高精度虛擬人。 2021年初EpicGames發布了可生成高保真角色形象的工具MetahumanCreator,基於預先製作的高品質模型,用戶可以方便快捷地定制自己的虛擬人模型。該工具的定位是讓小團隊和個人能夠快速、低門檻地生成自己所需的角色,大幅度提升美術效果,節約創作成本。
虛擬人的驅動依靠將人類的動作捕捉遷移至虛擬人模型。將動作捕捉採集到的動作遷移至虛擬人是目前3D虛擬人動作生成的主要方式。動作捕捉技術可按照實現方式的差異性分為光學式、慣性式、基於計算機視覺的動作捕捉方式等。
專業製作中常用光學捕捉和慣性捕捉。光學捕捉多應用於醫療、運動、電影等專業領域例如,2021年10月國內青瞳視覺攜手華為帶來全球首個5G+VR二次元偶像直播,完美展現了虛擬偶像曼妙的舞姿。慣性捕捉在影視作品中亦有較多應用,較好地呈現3D虛擬偶像形象並與用戶進行互動。未來,隨著計算機技術的進一步發展,動作捕捉技術有待取代低效的動作錄播技術,成為虛擬人動畫製作的主流技術。
而視覺捕捉技術,大大降低了使用門檻。視覺捕捉則多用在消費級市場,可以通過手機自帶深感攝像頭完成基礎的面部與肢體捕捉。隨著虛擬偶像加速吸引年輕群體,低門檻的視覺捕捉方案有望成為UGC創作者湧入虛擬偶像賽道的首選。如Epic推出的APPlivelinkface,可以輕鬆捕捉用戶面部動作並推流至製作平台。
渲染技術可分為實時渲染和離線渲染,前者速度快適合遊戲或交互式場景,後者算力強大更適合對精細度要求高的場景。實時渲染指圖形數據實時計算與輸出,其各幀都是針對實際的環境光源、相機位置和材質參數計算出來的圖像。早期的實時渲染技術渲染時間短,計算資源有限,但是隨著算法算力提升以及硬件水平的提升,渲染速度、逼真度等都實現了質的飛躍。離線渲染技術圖像數據並不是實時計算輸出,其渲染時間長,質量高,計算資源豐富。
虛擬人的製作——算力為王、邊緣崛起。時至今日,在面向元宇宙的虛擬人製作時,將更強調邊緣側算力。如前所述,元宇宙強調虛實結合,僅僅通過離線渲染是不夠的,而實時渲染對算力提出了極高要求。市場認為算力大都集中在雲端,但實時渲染恰需要在邊緣側解決,大量消耗邊緣+終端算力,這種架構與此前傳統的通信算力架構有較大區別。此前Unity就與Verizon合作開發高速、低延遲的數字解決方案,涵蓋從娛樂應用程序到企業工具包,源於獨立的引擎廠商無法解決邊緣計算的算力問題,通信、IT基礎設施服務商將發揮更大作用。
2.虛擬人交互——AI+真人的虛實相融
交互型數字人根據驅動方式的不同可分為AI智能驅動型和真人驅動型。真人運作配合動作捕捉,能夠使得虛擬人與觀眾進行實時交互。而智能驅動型數字人可通過智能係統自動讀取並解析識別外界輸入信息,根據解析結果決策數字人後續的輸出文本,然後驅動人物模型生成相應的語音與動作來使數字人跟用戶互動。虛擬人開發領域正在逐步打開市場空間。得益於深度學習、機器學習、計算機視覺、自然語言處理等先進計算機技術的發展,虛擬人將逐步融合客服答疑、智能營銷等功能,並塑造客戶良好的品牌形象,即將成為人機交互產品的價值突破點。
AI驅動的虛擬人依靠語音識別、自然語言處理、語音合成、語音驅動面部動畫等多種技術。在語音識別領域,國內的科大訊飛、百度、騰訊、阿里均有佈局。自然語言處理環節中的語義理解進展較為緩慢,相較於語音識別難度高了數倍,相對做的好的公司包括谷歌、IBM等。語音合成目前已經廣泛運用,但往往是片段錄播,離真正的自主表達還有一定距離。虛擬人在嘴形動作方面業已實現智能合成,其主要是通過建立輸入文本到輸出音頻與輸出視覺信息的關聯映射實現。主要設計思路是以採集到的文本到語音或嘴形動畫數據進行模型訓練,得到一個輸入任意文本都可以驅動嘴型動畫的模型,然後通過模型智能合成虛擬人嘴形。
商業化的虛擬人的價值何在?
1.服務型虛擬人有望快速發展
政策支持,傳媒場景將成為服務型虛擬人發展突破點。 10 月22 日,《廣播電視和網絡視聽” 十四五” 科技發展規劃》指出,推動虛擬主播、動畫手語廣泛應用於新聞播報、天氣預報、綜藝科教等節目,創新節目形態。傳媒場景的服務型虛擬人由此加速嘗試:由新華社媒體融合生產技術與系統國家重點實驗室與騰訊互娛旗下NExT Studios 聯合打造的虛擬記者小諍,首次亮相於6 月17 日神舟十二號載人飛船發射的當天,為觀眾帶來航天採訪。央視新聞引進AI技術打造的首位虛擬AI手語主播,為中國聽障群體帶來了冬奧會手語服務。
目前服務型虛擬人的寫實程度突破恐怖谷限制,應用場景將迎來發展。 “恐怖谷理論”揭示了人類對於人形事物會產生正面情感,直到直到一個特定程度,他們的反應便會突然變得極為排斥。哪怕機器人與人類只有一點點的差別,都會顯得非常顯眼刺眼,顯得非常僵硬恐怖。隨著虛擬人製作技術的提高,超寫實精度的虛擬人建模使得虛擬人提供的服務變得更加自然。當技術跨越這種恐怖谷的用戶體驗限制時,虛擬人與真人從外表無法區分時,應用場景將迎來更大的發展空間。
服務型虛擬人將在多個傳統領域帶來變革。通過打造特定應用場景的虛擬人,能夠大幅度提升用戶的業務體驗。典型的場景包括影視、金融、文旅、教育、醫療和零售。
2. 虛擬偶像市場規模穩步增長
目前虛擬偶像是虛擬人最為成熟的商業化應用,市場規模正在穩步增長。其中,虛擬人以虛擬主播Vtuber形式為主,主要原因在於門檻低、變現相對容易和迅速。 2016年虛擬主播“絆愛”在youtube上線,逐步開始廣泛流傳開來。 2020年1月至今年6月,嗶哩嗶哩上的虛擬主播數量增長了將近7倍,催化因素主要來源於以下兩點:疫情影響:線上娛樂市場整體增長,催生了新的觀眾市場,增加了需求。頭部虛擬IP退出:龍頭虛擬偶像團體“hololive”退出。頭部IP的突然空缺使得粉絲、市場、官方資源等急於尋求新的綁定,給與新的虛擬主播一定的發展機會。
參考2021年11月嗶哩嗶哩虛擬主播營收,當月虛擬主播總收入達到了5466萬元,付費人數達到了25.5萬人。位居第一位的虛擬主播“珈樂Carol”創下了單月214萬元的收入。其中,一場維持4小時的生日派對直播創下了單場189萬的收入。
虛擬偶像並不依賴於超寫實的虛擬人製作技術,但高精度的虛擬人製作技術為虛擬偶像帶來了新的運營方式。而隨著建模技術的提高,出現AYAYI、Miquela這類超寫實虛擬偶像,與真人難辨真假,因此在展示方式和商業模式上能夠有更多創新,可以擔任美妝博主、模特等。而早期的虛擬偶像往往是二次元形象,展示方式為音樂、動畫、CG等方式,這些虛擬偶像的內容表現形式一般為娛樂視頻。
元宇宙——賦予虛擬人“靈魂”
1. DAO將賦能社區創作
數字內容的生產和消費離不開社區。著名的“初音未來”是社區運營、自主生成內容機制的典型案例。 “初音未來”成立背景始於2007年,音樂軟件製作公司CRYPTON研發了一款Vocalid聲庫,同時配有“初音未來”人物的形象和一定的動作腳本。在2007年9月10日,就佔有了約30.4%的日本音樂軟件市場,是第二位的四倍。社區直接參與創造價值,並進行線上分享和傳播,“我支持偶像”變成了“我創作偶像”。
有大量的創作者將自己的音樂以“初音未來”的化身展現,但目前面臨著創作者流失的困境。 “初音未來”收穫了大量不同風格的內容,而作為內容提供者的音樂人也因此獲得關注,達到了雙贏的境地,形成了一個正向的循環。這也是“初音未來”生命週期如此長的原因之一。但近幾年,隨著初音未來的P主(創作者)離開,優質內容減少,IP影響力面臨威脅。最主要的原因是P主為社區的創作沒有對應的經濟報酬,用愛發電難抵柴米油鹽。
而依靠UGC社區創作的虛擬偶像生態,能夠與DAO結合產生新的商業模式,使生態參與者共享IP成長紅利。 DAO,即去中心化自治組織,是一種基於區塊鏈技術的數字世界組織形態,它的組織規則由分佈式的程序執行,能使參與者的利益一致,並且共同實現組織目標。 DAO有幾大特徵:信息透明、通證激勵、代碼開源、社區自治、參與者擁有對組織的所有權、自由開放。基於代幣經濟的DAO組織能夠讓創作者、粉絲都享受到IP生態發展的收益。
(關於DAO的詳細介紹可參見我們之前的報告《元宇宙(六):元宇宙的運行之DAO》)
2.虛擬化身與數字身份
Web3.0具有無需信任、去中心化等特點,用戶對於自己的數據隱私具有控制權。為了實現Web3.0,則需要各種技術的加持,包括區塊鏈、人工智能、物聯網等,這其中區塊鏈技術又與Web 3.0的願景尤為的契合,這也是區塊鏈被稱為“價值互聯網”的原因之一。
去中心化數字身份是Web3.0的核心特徵。 Web3.0中最重要的是用戶對自己身份數據的控制,身份所有者能夠在任何他們需要的地方使用其身份數據,而不需依賴特定的身份服務提供商。同時,借助區塊鏈技術,能夠保障用戶身份的安全性、自主性和可移植性。例如去中心化域名和NFT頭像,作為數字身份的象徵,掌握在用戶手中,可跨項目使用。
而虛擬人作為數字身份的象徵,未來能夠跨平台認證和使用。目前推特、Discord、小紅書等都在推進對NFT數字藏品的認證功能,保障唯一性的虛擬頭像能夠在多個平台互通,真正成為數字世界的身份象徵。而作為虛擬人的3D模型數據,未來也有望在各個項目平台中打通,真正實現元宇宙中的數字身份。
投資策略:虛擬人方興未艾,佈局製作+運營+邊緣計算賽道
我們預計未來5年內將有越來越豐富的虛擬人湧現,它們將不僅僅是遊戲中的NPC(non-player character),也將進一步在元宇宙中被賦予靈魂,以NFT的形態出現並配合AiGC(AI產生內容),運營模式也將從專業團隊向社區升級。同時,虛擬人對底層算力要求提升,邊緣計算(包括計算、通信、存儲等)場景日趨豐富。推薦關注虛擬人製作以及IP運營,我們梳理了以下標的以供參考,預計未來將有更多公司加入這一陣營:
風險提示
技術創新不及預期:虛擬人的技術發展不及預期。
區塊鏈政策監管風險:目前區塊鏈處於發展初期,全球各國對區塊鏈技術、項目融資和代幣的監管都存在一定不確定性,因此行業公司項目發展存在不確定性。
區塊鏈基礎設施開發不達預期。區塊鍊是解決供應鏈金融和數字身份中核心技術,目前區塊鏈基礎設施尚不能支撐高性能網絡部署,去中心化程度和安全都會對高性能存在一定的牽制,區塊鏈基礎設施存在開發不達預期的風險。
本文節選自國盛證券研究所已於2021年12月20日發布的報告《國盛區塊鏈| 元宇宙(七)虛擬人的“靈魂”是什麼? 》,具體內容請詳見相關報告。
展開全文打開碳鏈價值APP 查看更多精彩資訊