原文標題:《The Generative AI Revolution in Games》
原文作者:James Gwertzman、Jack Soslow
原文編譯:阿法兔研究筆記
A16Z 最近寫了一篇很有意思的文章,談到他們認為的生成式AI 和遊戲結合在一起的機會在哪,筆者翻譯後對部分內容進行了註解。文章主要兩部分:第一部分,包括A16Z 對遊戲領域生成式AI 的觀察和預測;第二部分,包括A16Z 對遊戲+ 生成式AI 領域的市場生態的判斷(第二部分將會在下一篇文章發出來,包括筆者對各個公司的解析)。
1. 前言
遊戲領域和生成式人工智能之間有什麼關聯?
遊戲設計領域存在不可能三角:成本、質量或速度這三項中通常只能取兩項,而現在,設計師可以通過這些AIGC 工具,不再需要花費很多人工的製作時間,只要幾個小時就能創造出高質量的圖像,而這其中,真正具有變革意義的是,任何人只要學會幾個簡單的工具,就可以獲得這種具備創造性的能力。
這些工具,能夠以快速迭代的方式創造出無窮無盡的變化,並且一旦經過培訓,整個過程是實時的,也就是說,結果幾乎是即時可用的。
自Real-time 3 D 技術出現以來,還沒有能夠對遊戲產生如此大潛在改變的技術(有了實時3 D 的軟件,整個虛擬世界可以眼以更快的速度進行數字渲染,為用戶提供了更具吸引力和身臨其境的體驗)。
那麼,生成式AI 的發展方向是什麼?又將如何改變遊戲?首先,我們回顧一下生成式AI 的概念。
什麼是生成式AI?
生成式AI 是機器學習的一個類別,計算機可以根據用戶的輸入/ 提示,生成原創的新內容。目前這項技術最成熟的應用主要在文本和圖像領域,不過幾乎所有的創意領域都有類似的進步(生成式AI 的技術應用),覆蓋動畫、聲音效果、音樂,甚至是對具備完整個性的虛擬人物進行原創。
當然,人工智能在遊戲中並不新鮮。即使是早期的遊戲,如雅達利的《Pong》早就有計算機控制的對手和玩家進行對戰。 (筆者註:遊戲開發商雅達利,創辦時期在微處理器誕生後不久,在1972 年推出首款街機Pong,奠定街機鼻祖地位。 1974 年,蘋果的喬布斯加入雅達利,負責開發電子遊戲)
然而這些計算機中的虛擬對手和我們今天講的生成式人工智能並不一樣,這些計算機對手只是遊戲設計師精心設計的腳本程序,它們確實模擬了一個人工智能的對手,但它們不能學習和迭代,水平和編寫它們的工程師一樣。
那麼,生成式AI 和遊戲的結合,技術底層有哪些變化?微處理器的速度更快,雲計算和各種計算能力更強,具備建立大型的神經網絡的潛力,可以在識別高度複雜領域的模式和表徵。 (Thanks to faster microprocessors and the cloud. With this power, it’s possible to build large neural networks that can identify patterns and representations in highly complex domains. 筆者註:這裡的意思是越來越快的微處理器單體能力乘上雲計算的規模化係數,使建立能夠支持複雜的模式識別,啥是模式識別?模式識別是指對錶徵事物或現象的各種形式的( 數值的、文字的和邏輯關係的) 信息進行處理和分析,以對事物或現象進行描述、辨認、分類和解釋的過程, 是信息科學和人工智能的重要組成部分)
本篇文章主要兩部分:
-
第一部分,包括A16Z 對遊戲領域生成式AI 的觀察和預測;
-
第二部分,包括A16Z 是我們對遊戲+ 生成式AI 領域的市場生態:Market Map ,這部分概述了各個細分市場,指出了每個細分市場的主要公司。
第一部分:觀察和預測
一些假設:
首先探討一下文章餘下部分所依據一些假設:
1. 通用式人工智能的研究(成功)數量將繼續增長,出現更多更有效的技術。
上圖是每月arXiv 中發表的關於機器學習或人工智能的學術論文數量。正如圖中所示,論文的數量正在呈指數級增長,且沒有放緩的跡象,而這部分數據僅僅包括已經發表的論文,還有許多研究並沒有公開發表,而是直接應用於開源模型或產品研發,這些開源模型和產品,帶來了爆炸式的創新。
2. 在所有娛樂類目中,遊戲將成為收到生成式人工智能最大影響的領域。
就目前所涉及的資產類型( 2 D 藝術、 3 D 藝術、聲音效果、音樂等)而言,遊戲是娛樂類目中最複雜的一種,同時,遊戲也是互動性最強的,它非常強調實時體驗。這就為新的遊戲開發者創造了一個非常高的進入門檻,也為製作一個真正的3 A 大作遊戲創造了高昂的成本,這些存在的門檻和成本問題,為生成式人工智能在遊戲領域的破壞性創新,創造了巨大的機會(如下圖):
舉個例子,像《荒野大鏢客:救贖2 (Red Dead Redemption 2 )》這樣的遊戲是有史以來製作成本最昂貴的遊戲之一,它的製作成本近5 億美元。而荒野大鏢客是也是市場上巨具備最棒的視覺效果之一的遊戲,花了近8 年的時間來製作,有1000 多個遊戲角色(並且每個角色都有自己的個性、和專屬配音演員),一個近30 平方英里大小的遊戲世界, 6 個章節的100 多個任務,以及由100 多個音樂家創作的近60 小時的音樂,這個遊戲的所有內容涉及的製作都非常龐大。
那麼,如果我們將《荒野大鏢客:救贖2 》與《微軟模擬飛行》相比,《微軟模擬飛行》這個遊戲更為巨大…因為微軟飛行模擬器的玩家能夠在遊戲中圍繞整個地球飛行,所有1.97 億平方英里的地方。那麼,微軟是如何打造這樣一個大型遊戲的呢?主要是通過人工智能來完成,微軟公司與blackshark.ai 合作,對人工智能進行訓練,從二維衛星圖像生成無限逼真的三維世界。
blackshark.ai 是個啥公司?
blackshark.ai 是通過機器學習技術,提取全球範圍內的地球基礎設施的公司,從全球的衛星和航空圖像中提取數據,用人工智能基於目前地理數據的數字孿生場景,這些結果可用於可視化、模擬、繪圖、混合現實環境和其他企業解決方案,而技術本身俱備的雲計算更新能力,能夠實時更新這些數據。
這僅僅是一個例子,如果不使用人工智能技術,《微軟模擬飛行》這款遊戲實際上是不可能製作完成的。除此之外,遊戲的成功還要歸功於這些模型可以隨著時間的推移不斷改進,例如,可以加強「highway cloverleaf overpass」模型,通過人工智能運行整個建造過程,遊戲中的整個地球上的所有的高速公路立交橋都可以立馬得到改進。
3. 遊戲製作中涉及的每一個資產都會有一個生成的AI 模型
到目前為止,像Stable Diffusion 或MidJourney 這樣的2 D 圖像生成器,由於其能夠生成的圖像十分搶眼,佔據了目前生成式人工智能的大部分流行的興奮點。而現在已經出現了用於遊戲中幾乎所有資產的生成式人工智能模型,從3 D 模型到角色動畫,再到對話和音樂。 (下一篇文章會講一下具體公司的市場生態Market Map)
4. 內容成本將持續下降,某些情況下的內容的成本會降為零
當我們和嘗試將生成式AI 人工智能整合到製作場景的遊戲開發者交談時,最大的興奮點在於,製作遊戲的時間和成本都會大幅降低。一位開發者告訴我們,為一張圖片生成概念圖的時間從3 週下降到1 小時。我們相信,在整個遊戲流程的製作過程中也可以實現類似的「降本增效」。
值得注意的是,藝術家並沒有被取代的危險,這意味著藝術家不再需要自己親自上手去完成所有的工作:藝術家和設計師們可以設定初始的創意方向,然後將大部分耗時和技術執行工作交給人工智能。在這一點上,就像早期手繪動畫的畫師一樣,高度熟練的「繪畫專家」描繪出動畫的輪廓,然後由成本相對較低的畫手們完成耗時的工作,為動畫膠片上色,填充線條,只是我們談到的是遊戲創作領域的應用。
5. 我們仍然處於這場行業變革領域的初期,尚且有很多部分需要完善
儘管最近很多人都很激動,但我們仍然剛剛處於起跑線。在大家清如何真正應用這種新技術與遊戲領域的結合時,還有大量的工作要做,而對那些之前、以及迅速進入這個新領域的公司來說,將會存在巨大的機會。
對於未來的預測
鑑於以上的假設,本文對於遊戲行業如何被改造這塊,進行了預測和推演。
1. 學習如何有效地應用生成式人工智能,能將成為一種市場技能。
已經有先驅分子能比其他人更有效地應用生成式人工智能。為了最好的用好這項新技術,還需要了解各種工具和技術,並知道如何對它們進行組合應用。我們預測有效地應用生成式人工智能,本身就會成為非常有潛力的技能,因為它可以將藝術家的創造性視野與程序員的技術能力結合起來。
Chris Anderson 有句名言:「Every abundance creates a new scarcity 豐富將會造就新的稀缺。」隨著內容逐漸變得更為豐富,那些了解如何與人工智能工具進行最為高效的合作的藝術家將是最緊缺的。
舉例:將生成式人工智能用於藝術品的生成,也會帶來一些挑戰,包括:
-
保持連貫性:需要能夠對遊戲中的各類資產進行修改或編輯,對於人工智能工具,這意味著需要能夠以相同的信號來複製(數字)資產,這樣我們才可以對它進行修改和挑戰。這可能很會棘手,因為同樣的提示,可能會產生截然不同的結果。
-
保持風格的一致性:單個遊戲中的所有藝術作品都要保持一致的風格,這就意味著,人工智能的工具需要經過訓練或與藝術家/ 設計師的既定風格相聯繫。
2. 遊戲開發門檻的降低,將會導致更多的冒險和創造性探索
我們可能很快就會進入一個新的遊戲開發「黃金時代」,較低的准入門檻會導致出現更多創新和創造性遊戲,而這不僅僅是因為較低的製作成本導致了遊戲製作商需要擔的風險較低,還因為這些工具代表了為更多受眾創造高質量內容的能力。
3. 由人工智能輔助的的「微型遊戲工作室」逐步崛起
有了生成式人工智能的工具和服務,也許更多可行的商業遊戲,會由只有1 或2 名員工的小型「微型工作室」製作。當然,小型獨立遊戲工作室已經很常見,熱門遊戲《Among Us》(筆者註:Among Us 是一款由Innersloth 製作發行的策略休閒遊戲,可以進行4-10 人聯機遊玩,於2018 年11 月17 日發售)是由只有5 名員工的工作室Innersloth 製作的,而這些小型工作室能夠創造的遊戲的規模將增長。
4. 每年發布的遊戲數量會增加
Unity 和Roblox 的成功表明,提供強大的創意工具會導致更多的遊戲被建造。生成性人工智能將進一步降低門檻,創造更多的遊戲。這個行業已經遭受了發現挑戰– 僅去年就有超過1 萬個遊戲被添加到Steam 上– 這將給發現帶來更大的壓力。然而,我們也將看到…
5. 新的遊戲類型將會被創造出來
將會有新的遊戲類型被發明出來,像前文提到的《微軟模擬飛行》,但全新的遊戲類型發明出來,這種遊戲會和新內容的實時生成結合起來。
例如Spellbrush 的RPG 遊戲Arrowmancer,以人工智能創造的角色為特色,幾乎沒有限制的新玩法。還有的遊戲開發商,正在使用人工智能讓玩家在遊戲中創建自己的頭像:根據玩家的描述來自動生成頭像圖片。注意,從用戶端的體驗來看,讓玩家通過人工智能生成內容,能讓玩家感知到更大的所有權。
6. 價值將歸於特定行業的AI 工具,而不僅僅是基礎模型
圍繞Stable Diffusion和Midjourney 等基礎模型的熱度,正在產生極其誇張的估值,但隨著新研究的持續湧現,新模型將隨著新技術的完善而出現和不斷迭代。從目前3 個流行的生成性人工智能模型(Dall-E、Midjourney 和Stable Diffusion)的網站搜索流量來看,每個新模型都有圍繞它的特定關注點。
另一種途徑是構建符合行業需求(垂直行業)工具套件,這些工具會專注於特定行業的生成式人工智能需求,深入了解特定的受眾,並與現有的生產場景(Unity 或Unreal)進行整合。 (筆者註:上篇翻譯的Coatue 白皮書 AIGC 的機會到底在何處?其中提到了Adobe 和Office 套件與AI 的結合,類似的需求也存在遊戲領域,值得關注)
一個典型的例子是Runway,Runway 針對視頻創作者的需求,提供人工智能輔助工具,如視頻編輯、綠屏移除、內畫和運動跟踪,這樣的工具可以隨著時間的推移增加新的應用場景。目前還沒有看到像Runway 這樣的遊戲工具出現,但這是一個有潛力的領域。
7. 即將面臨的法律挑戰
所有這些生成式人工智能模型的共同點是,這些AI 模型都是使用大量的內容數據集進行訓練的,通常是通過互聯網的數據集來創建。例如,「Stable Diffusion」是在超過50 億張圖片/ 標題的基礎上進行訓練的,這些圖片/ 標題都是從網絡上採集而來的。目前,這些模型聲稱在「合理使用」的版權原則下運作,但這一論點還沒有在法律得到明確的檢驗。顯然即將到來的法律挑戰可能會改變生成式人工智能的格局。
大型電影公司有可能通過自己版權的優勢建立專有模型,尋求競爭優勢。例如,微軟有很多旗下的工作室,特別是還收購了動視暴雪。
8. 至少在目前,不同於藝術領域,生成式AI 會不會在編程領域帶來巨大的變革。
軟件工程是遊戲開發的另一個主要成本來源,但用人工智能模型生成代碼需要更多的測試和驗證,因此,代碼生成比生成創意資產的生產力提升程度要低。我們認為,像Copilot 這樣的編碼工具可能為工程師提供適度的性能改進,但在短期內不會和內容領域變化這麼大。
一些建議
1. 開始探索生成性人工智能:想要弄清楚如何充分利用這場即將到來的生成式人工智能革命的力量,還需要一段時間。早開始發展業務的公司未來會具備優勢,有幾個工作室正在進行內部實驗項目,探索這些技術如何影響遊戲製作。
2.尋找市場空白之處的機會
目前整個賽道的很多部分已經非常擁擠,如動畫、語音、對話,但還有很多領域是廣泛開放的。我們鼓勵對這一領域感興趣的創業者將目光集中在仍未開發的領域,如「遊戲+ 生成式AI 賽道」。