作者:Jonathan Lai,a16z合夥人;翻譯:金色財經xiaozou
關於遊戲領域的生成式AI革命的早期討論主要集中在AI工具如何使遊戲創建者更加高效——使遊戲創建能夠比以前更快、規模更大。儘管如此,我們認為從長遠來看最大的機會不僅僅在於利用AI來改變我們創建遊戲的方式,還在於改變遊戲自身的性質。
我們很高興看到生成式AI有機會促進新的AI-first遊戲類別的創建,並極大地擴展現有遊戲類型。從Rogue的程序生成地下城(1980年)到Half-Life的有限狀態機(1998年),再到Left 4 Dead的AI遊戲導演系統(2008年),AI一直在推動新形式的遊戲玩法。關於深度學習方面的最新進展使計算機能夠根據用戶提示和大數據集生成新內容,這進一步改變了遊戲規則。
前期,我們已經看到了一些有趣的AI遊戲玩法領域,包括生成式智能體、個性化定制、AI敘事、動態世界和AI助手。如果成功的話,這些系統可以結合在一起,創建出新的AI-first遊戲類別,這類游戲將能夠長期娛樂、吸引並留住玩家。
1、Generative Agent(生成式智能體)
1989年,Maxis的SimCity開創了模擬題材遊戲的先河,在這款遊戲中,玩家可以建造並管理一座虛擬城市。如今,最受歡迎的模擬遊戲是The Sims,在這款遊戲中,全球超7000萬玩家管理著“sims”虛擬人物,這些人物在這個虛擬世界裡上演著日常生活。遊戲設計師Will Wright曾將The Sims遊戲比作“互動娃娃屋”。
生成式AI可以極大地推動模擬遊戲的發展,通過LLM大語言模型使智能體具有突發的社會行為,從而更加逼真。
今年早些時候,來自斯坦福大學和谷歌的一組研究人員發表了一篇關於如何將LLM應用於遊戲智能體的文章。在博士生Joon Sung Park的帶領下,研究團隊用25個類似Sims的智能體填充了一個像素藝術沙盒世界,這些智能體的行為由ChatGPT和“擴展LLM的架構來存儲智能體使用自然語言的完整記錄,將這些記憶合成為更高層的反射,並動態檢索以規劃行為。”
這有可能讓模擬遊戲迎來更精彩的未來。一開始,只有一個用戶指定的建議,一個智能體想要舉辦一個情人節派對,各智能體們獨立地分發派對邀請,建立新的友誼,互邀在兩天后準時出現在派對上。
使這種行為成為可能是因為LLM是使用社交網絡數據訓練的,因此在LLM模型中有人類如何在各種社交環境下交談和行為的構建塊。在像模擬遊戲這樣的交互式數字環境中,這些反應可以被觸發,創造出令人難以置信的逼真的突發行為。
從玩家的角度來看,最終結果是:更加沉浸式的遊戲玩法。玩The Sims或殖民地建造經營模擬遊戲RimWorld的大部分樂趣便來自於意想不到的情景,以及情緒的起起伏伏。通過社交網絡語料庫支持的智能體行為,我們可能會看到模擬遊戲不僅反映了遊戲設計師的想像力,還反映了人類社會的不可預測性。觀看這些模擬遊戲就像觀看新一代的《楚門的世界》,帶給玩家無盡的樂趣,這是今天預先編寫好的電視或電影無法辦到的。
利用我們對充滿想像力的“娃娃屋”的渴望,智能體本身也可以個性化。玩家可以根據自己或虛構的角色塑造一個理想的智能體。 Ready Player Me允許用戶通過自拍生成自己的3D頭像,並將他們的頭像導入超9000款遊戲/應用程序。 AI角色平台Character.ai、InWorld和Convai允許創建具有自己的背景故事、個性化和行為控制的自定義NPC。想要創建一個Hogwarts模擬遊戲,在那裡你是哈利波特的室友?現在可以了。
憑藉智能體高超的自然語言能力,我們與智能體互動的方式也得以擴展。如今,開發人員可以使用Eleven Labs的text-to-speech(文本到語音)模型為他們的智能體生成逼真的聲音。 Convai最近與NVIDIA合作進行了viral demo,其中玩家可以與AI拉麵廚師NPC進行自然的語音對話,對話和匹配的面部表情會實時生成。人工智能陪伴應用Replika已經允許用戶通過語音、視頻和AR/VR與AI夥伴交談。未來,我們可以設想這樣一款模擬遊戲:玩家可以在旅途中隨時隨地通過打電話或視頻聊天與他們的智能體保持聯繫,回到電腦前再點擊進入更加沉浸式的遊戲玩法。
要知道,在我們看到一個完整的Sims版本之前,還有很多難題需要解決。 LLM在他們的訓練數據中存在固有偏差,這可以從智能體的行為中看出。在雲端7*24小時實時運行規模化模擬遊戲的成本可能在財務上並不可行——在2天內運行25個智能體會花費研究團隊數千美元的計算費用。有望將模型工作負載轉移到設備上,但相關工作仍然相對較早。我們可能還需要發現與智能體之間的準社會關係的新規範。
但有一件事是明確的——如今對生成式智能體的需求巨大。在我們最近的調查中,有61%的遊戲公司計劃嘗試AI NPC。我們認為,隨著智能體進入我們的日常社交領域,AI陪伴將很快變得司空見慣。模擬遊戲提供了一個數字沙盒,我們可以以有趣的不可預測的方式與我們最喜歡的AI夥伴互動。從長遠來看,模擬遊戲的性質可能會發生變化,將反映出這些智能體不僅僅是玩具娃娃,還是潛在的朋友、家人、同事、顧問,甚至是戀人。
2、個性化定制
個性化遊戲的最終目標是為每個玩家提供獨特的遊戲體驗。例如,讓我們先來看角色創建,無論是最初的Dungeons & Dragons桌遊還是Mihoyo的Genshin Impact,角色創建幾乎是所有角色扮演遊戲(RPG)的支柱。大多數RPG都允許玩家通過預設選項自定義外貌、性別、職業等。但如果你能超越預設,為每個玩家和通關生成一個獨特的角色怎麼樣?將LLM與text-to-image(文本到圖像)的擴散模型(如Stable Diffusion或Midjourney)相結合的個性化角色構建者可以實現這一點。
Spellbrush的Arrowmancer是一款RPG遊戲,由該公司基於GAN的定制化動畫模型提供支持。 Arrowmancer的玩家可以生成一整套獨特的動畫角色,具體到藝術風格和戰鬥能力。這種個性化定制也是其盈利系統的一部分——玩家將他們的AI角色導入自定義的gacha banner中,藉此複製角色來加強他們的團隊。
個性化定制也可以擴展到遊戲道具中。例如,AI可以幫助生成只有完成特定任務的玩家才能使用的獨特武器和護甲。 Azra Games已經建立了一個AI驅動的資產pipeline,可以快速構思和生成巨大的遊戲內物品和世界對像庫,為更多樣化的玩法鋪平道路。 AAA級遊戲開發商Activision Blizzard創建了Blizzard Diffusion,這是圖像生成器Stable Diffusion的翻版,可以幫助生成各種各樣的角色和服裝概念藝術。
遊戲中的文本和對話也適合個性化定制。遊戲世界中的各種標誌可以反映玩家的頭銜或地位。 NPC可以被設置為具有不同個性的LLM智能體以適應你的行為——例如,對話可以根據玩家與智能體之間發生過的行為而改變。我們已經在一款AAA級遊戲中看到了這一理念的成功執行——Monolith的Shadow of Mordor便擁有一個複仇系統,能夠基於玩家的行動動態地創造出有趣的反派背景故事。這些個性化元素使得每個玩法都是獨一無二的。
遊戲發行商Ubisoft最近發布了一款基於LLM的對話工具Ghostwriter。發行商的作者現在使用該工具來生成背景對話和bark(在觸發事件期間的對話片段)初稿,這有助於模擬玩家身邊的現實世界。通過微調,像Ghostwriter這樣的工具可能會被用於定制個性化的bark。
從玩家的角度來看,關於這些個性化定制的影響是雙重的:增加了遊戲的沉浸感和重玩價值。 Skyrim和Grand Theft Auto 5等沉浸式開放世界遊戲的角色扮演模式經久不衰,這表明了對個性化故事的潛在需求。即使在今天,GTA在角色扮演服務器上的玩家數量也一直高於原版遊戲。我們認為個性化系統將成為所有遊戲長期吸引和留住玩家的重要工具。
3、AI敘事
當然,優秀的遊戲不只是角色和對話。還有一個令人興奮的機會是利用生成式AI來講述更好、更個性化的故事。
遊戲個性化敘事的鼻祖是Dungeons & Dragons,在該遊戲中,一個被稱為地下城主的人會準備一個故事向一群人講述,這些人在故事中扮演著不同的角色。這樣的故事一部分是即興的,一部分是RPG,這意味著每個通關都是獨一無二的。作為個性化故事需求的信號,D&D如今極度受歡迎,其數字和模擬產品的銷量均創下了歷史紀錄。
如今,許多公司將LLM應用於D&D的故事模型,機會就在於讓玩家在極其耐心的AI敘事生成器的引導下,在他們喜歡的玩家創建或IP世界中花費盡可能多的時間。 Latitude的AI Dungeon於2019年發布,是一款開放式的文字類冒險遊戲,AI在遊戲中扮演地下城主。用戶還對OpenAI的GPT-4版本進行了微調,享受效果不錯的D&D體驗。 Character.AI的文字類冒險遊戲是該應用最受歡迎的模式之一。
Hidden Door更進一步,在一組特定的原始材料上訓練它的機器學習模型——例如The Wizard of Oz——允許玩家在已建立的IP世界中大冒險。通過這種方式,Hidden Door與IP所有者合作,實現了一種全新的、互動式的品牌延伸形式。一旦粉絲們看完一部電影或一本書,他們就可以繼續在自己喜歡的世界裡進行自定義的D&D式的冒險。對粉絲體驗的需求正在蓬勃發展——兩個最大的在線同人小說庫Archiveofourown.org和Wattpad僅在5月份就分別有超過3.54億和1.46億的網站訪問量。
NovelAI已經開發了自己的LLM Clio,利用其在沙盒模式下講故事,並幫助解決人類作家會面臨的寫作障礙。對於目光敏銳的作家來說,NovelAI讓用戶可以根據他們自己的作品對Clio進行微調,甚至是像HP Lovecraft或Jules Verne這樣的著名作家。
值得注意的是,AI敘事還面臨著許多障礙。開放式AI很容易偏離軌道,這讓一切變得有趣,但對遊戲設計來說卻很麻煩。如今,創建一個優秀的AI敘事生成器需要大量的人類規則設置來創建好故事的敘事弧線。記憶和連貫性很重要——敘事生成器需要記住一個故事之前發生的事情,並且保持事實和風格的連貫性。對於很多閉源LLM來說,解釋能力仍然是一個挑戰,因為它們就像黑盒一樣運行,而遊戲設計師則需要理解為什麼系統會以這種方式運行以改善遊戲體驗。
然而,隨著這些障礙正在被攻克,AI現如今已經成為人類故事講述者的助手了。現在,成千上百萬作家都在使用ChatGPT為自己的故事提供靈感。娛樂工作室Scriptic利用DALL-E、ChatGPT、Midjourney、Eleven Labs和Runway,和人類編輯團隊一起來構建交互式的、可自主選擇的冒險節目,在Netflix上就可觀看。
4、動態世界構建
雖然基於文本的故事很受歡迎,但許多玩家也渴望看到他們的故事在視覺上能夠栩栩如生。生成式AI在遊戲領域的最大機會之一可能就是幫助創造玩家將在其中度過無數時間生活的世界。
雖然在今天還不可行,但一個常被提及的願景就是隨著玩家在遊戲中的進展情況實時生成關卡和內容。這類游戲的一個典型例子就是Mind Game。 Mind Game是一款AI指導的遊戲,可以實時適應每個學生的興趣,遊戲世界基於學生的行為和AI可以推斷的任何其他心理信息而發展變化。
今天,最接Mind Game的遊戲可能就是Valve的Left 4 Dead了——該遊戲利用AI Director導演系統來控制遊戲的動態節奏和難度。 AI Director沒有為敵人(殭屍)設置出生點,而是根據每個玩家的狀態、技能和位置將殭屍放置在不同的位置,設置為不同的數量,從而在每個通關中創造獨特的體驗。該導演系統還通過動態視覺效果和音樂來營造遊戲氛圍。 Valve創始人Gabe Newell將這一系統稱為“procedural narrative”(程序敘事)。 EA廣受好評的Dead Space Remake使用了該AI導演系統的變體來最大化恐怖感。
雖然這在今天看來似乎屬於科幻小說領域,但有可能有一天,通過改進的生成式模型以及獲取足夠的計算和數據,我們可以構建這樣一個AI Director:不僅能夠生成超級恐怖的感覺,還能生成世界本身。
值得注意的是,遊戲領域裡機器生成關卡的概念並不新鮮。從Supergiant的Hades到Blizzard的Diablo,再到Mojang的Minecraft,如今許多最受歡迎的遊戲都使用了程序生成技術——一種隨機生成關卡的技術,使用由人類設計師運行的方程式和規則集,每次的通關都有所不同。一個完整的軟件庫已經建立用於協助程序生成。 Unity的SpeedTree可以幫助開發者生成虛擬樹葉,就像你在電影阿凡達中的潘多拉森林或Elden Ring的風景中看到的那樣。
遊戲可以將程序資產生成器與用戶界面中的LLM結合起來。遊戲Townscaper使用程序化系統,只需要兩項玩家輸入值(塊位置和顏色),就可以變成絢麗的城鎮景觀。想像一下,Townscaper在用戶界面中添加一個LLM,幫助玩家通過自然語言提示迭代出更加微妙和美麗的創作。
許多開發人員也對利用機器學習增強程序生成的潛力感到興奮。有一天,設計師可能會使用在風格相似的現有關卡上訓練的模型,迭代生成一個可行的關卡初稿。今年早些時候,Shyam Sudhakaran帶領哥本哈根大學的一個團隊創建了MarioGPT——一個GPT2工具,可以使用在超級馬里奧1和2的原始關卡上訓練的模型來生成超級馬里奧關卡。關於該領域的學術研究已有一段時間了,包括2018年使用生成式對抗網絡(GAN)設計第一人稱射擊遊戲DOOM關卡的項目。
生成式模型與程序系統協同工作,可以顯著加快資產創建速度。藝術家已經在使用文本到圖像的擴散模型來製作AI輔助的概念藝術和故事板。
關於3D生成也有大量研究。 Luma使用神經輻射場(NeRFs)允許消費者通過iPhone上捕獲的2D圖像構建出逼真的3D資產。 Kaedim在loop質量控制中使用AI和人類一起創建生產就緒的3D網格,如今已被至少225個遊戲開發者使用。 CSM最近發布了一個專有模型,可以從視頻和圖像中生成3D模型。
從長遠來看,最重要的是使用AI模型進行實時世界構建。我們認為未來整個遊戲將不再需要渲染,而是使用神經網絡在運行時生成。 NVIDIA的DLSS技術已經可以使用消費級GPU實時生成新的更高分辨率的遊戲幀。有一天,你也許可以點擊Netflix電影的“互動”按鈕,就能進入一個每個場景都在實時生成的世界,並為玩家提供獨特的個性化服務。在未來,遊戲將變得與電影無異。
值得注意的是,動態生成的世界本身並不足以創建出一款優秀的遊戲,這一點從人們對No Man’s Sky的批評中就可看出,該遊戲發佈時便擁有了超過18萬億的程序生成行星。動態世界的前景在於它可與其他遊戲系統(如個性化定制、生成式智能體)相結合,開啟敘事新形式。畢竟,Mind Game最吸引人的部分就是它如何為終端玩家塑造玩家自己的世界,而非遊戲世界本身。
5、AI Copilot:所有遊戲的AI助手
我們之前討論了在模擬遊戲中使用生成式智能體,這裡還有另一個新用例,即AI充當遊戲助手來指導我們玩遊戲,在某些情況下甚至能與我們一起玩。
AI copilot對於引導玩家進入複雜遊戲來說是非常重要的。例如,Minecraft、Roblox或Rec Room等UGC沙盒都是非常豐富的環境,如果玩家有合適的材料和技能,他們幾乎可以在其中建造任何他們想像的東西。但存在一個難度很高的學習過程,大多數玩家都不太容易能弄清楚該如何起步。
AI copilot可以讓任何玩家成為UGC遊戲中的Master Builder——根據文本提示或圖像提供逐步指導,並指導玩家克服錯誤。 LEGO世界裡的“Master Builder”概念就是一個恰當的參照對象——少數人有能力在需要的時候看到他們所能想像的任何創造的藍圖。
微軟已經在為Minecraft開發AI copilot,使用DALL-E和Github Copilot,使玩家能夠通過自然語言提示將資產和邏輯插入Minecraft。 Roblox正在積極地將生成式AI工具整合到Roblox平台中,其使命是讓“每個用戶都成為創造者”。無論是使用Github Copilot進行編碼還是使用ChatGPT進行寫作,AI copilot在共創方面的高效性已經在很多領域裡得到了證明。
除了共創,受過人類游戲玩法數據訓練的LLM應該能夠理解如何在各種遊戲中如何行為。通過適當的整合,智能體可以在玩家的伙伴不在時充當合作夥伴,或者在像FIFA或NBA 2k這樣的正面交鋒的遊戲中充當對手方。這樣的智能體總是可以隨叫隨到,不管結果是勝利還是失敗,總是那麼和藹可親,從不評頭論足。根據我們的個人遊戲歷史進行微調,智能體可以大大優於現有的機器人,完全按照我們自己的方式或者以互補的方式玩遊戲。
已有類似的項目在約束環境測試下成功運行。熱門賽車遊戲Forza開發了一個Drivatar系統,該系統利用機器學習為每個人類玩家創建一個AI駕駛員,模仿他們的駕駛行為。這些Drivatar被上傳到雲端,當他們的人類夥伴離線時,他們可以被召喚出來與其他玩家比賽,甚至可以獲勝賺積分。谷歌DeepMind的AlphaStar在Starcraft II “長達200年”的遊戲數據集上進行訓練,創造出可以在遊戲中與人類職業電競選手比賽並獲勝的智能體。
AI copilot作為一種遊戲機制甚至可以創建全新的遊戲玩法模式。設想一下這樣的Fortnite,每個玩家都有一個Master Builder魔杖,可以通過提示立即建造狙擊塔或燃燒的巨石。在這種遊戲模式中,勝利可能更多取決於魔杖的操作(提示),而非瞄準能力。
完美的遊戲內AI“夥伴”的夢想已經成為許多熱門遊戲中令人難忘的一部分——只要看看Halo世界裡的Cortana,The Last of Us中的Elle,或者Bioshock Infinite中的Elizabeth就知道了。而對於競技遊戲來說,打敗電腦機器人永遠不會過時——從Space Invaders中的摧毀外星人,到Starcraft中的comp stomp,最終發展為自己的遊戲模式Co-op Commanders(合作指揮官)。
隨著遊戲演變成下一代社交網絡,我們預計AI copilot將扮演越來越重要的社交角色,如教練及/或合作夥伴。眾所周知,添加社交功能可以提高遊戲的粘性——有好友的玩家留存率可以提高5倍。我們預期未來每款遊戲都會有一個AI copilot,將遵循這樣一句箴言:“一個人玩很好,與AI一起玩更好,與朋友一起玩最好。”
6、結論
我們還處於將生成式AI應用於遊戲的早期階段,在將這些想法投入生產之前,還需要解決許多法律、道德和技術方面的障礙。除非開發者能夠證明其擁有所有用於訓練模型的數據的所有權,否則帶有AI生成資產的遊戲的法律所有權和版權保護在今天基本上是不明確的。這使得現有IP的所有者很難在他們的生產中使用第三方AI模型。
對於該如何補償訓練數據背後的原作者、藝術家和創作者,也存在很大的擔憂。難點在於,目前大多數AI模型都是使用互聯網上的公共數據進行訓練的,其中大部分數據是受版權保護的。在某些情況下,用戶甚至可以使用生成式模型再現某位藝術家的確切風格。現在還為時尚早,對內容創作者的補償需要適當地確定。
最後,現在的大多數生成式模型成本太高,無法在雲端全球規模7*24小時運行,而這是當今的遊戲運營所必需的。為了實現經濟高效的擴展,應用程序開發人員可能需要找到方法將模型工作負載轉移至終端用戶設備,但這還需要時間。
然而,目前可以確定的是,有大量的開發者活動和玩家對遊戲領域的生成式AI大有興趣。雖然少不了很多炒作,但我們很高興看到該領域確實有很多才華橫溢的團隊,他們廢寢忘食地致力於開發創新的產品和體驗。
我們的機會不僅在於讓現有遊戲變得更快、更便宜,還在於解鎖以前不可能出現的AI-first遊戲新類別。我們不知道這些遊戲最終會是什麼樣兒,但我們知道遊戲產業的歷史一直都是技術推動新形玩法的歷史。回報可能是巨大的——有了生成式智能體、個性化定制、AI敘事、動態世界構建和AI copilot這樣的系統,用不了多久我們可能就會看到由AI-first開發者創建的第一款“永無止境”的遊戲。