撰文:PSE Trading Analyst @Minta
Key Insights
- AI Agent 是基於LLM 通用大模型的工具,供開發者和使用者直接建立可自主互動的應用。
- AI 賽道未來的主要格局可能是:「通用大模型+ 垂體應用」;AI Agent 的生態位是連結通用大模型和Dapp 的中間件,所以AI Agent 護城河較低,需靠打造網路效應和提升用戶黏性提升長期競爭力。
- 本文整理了「通用大模型、垂類應用Agent、以及Generative AI 應用」在Web3 遊戲賽道的發展。其中,結合Generative AI 技術,非常有潛力在短期內出爆款遊戲。
01 技術簡介
今年爆紅的人工通用智慧AGI(Artificial General Intelligence)技術中,大型語言模式(Large Language Model – LLM)是絕對的主角。 OpenAI 核心技術人員Andrej Karpathy 和Lilian Weng 也表達過基於LLM 的AI Agents 是AGI 領域接下來重要的發展方向,許多團隊也在開發基於LLM 驅動的人工智慧代理( AI-Agents) 系統。簡單來說,AI Agent 是一種電腦程序,它使用大量數據和複雜的演算法來模擬人類的思維和決策過程,以便執行各種任務和交互,例如自動駕駛、語音識別和遊戲策略等。 Abacus.ai 的圖片清晰的介紹了AI Agent 的基本原理,步驟如下:
- 感知與資料擷取:資料輸入,或AI Agent 透過感知系統(感測器、攝影機、麥克風等裝置)來獲取資訊和數據,例如遊戲狀態、影像、聲音等。
- 狀態表示:資料需要被處理和表示成Agent 可以理解的形式,例如轉換為向量或張量,以便於輸入到神經網路中。
- 神經網路模型:通常使用深度神經網路模型來進行決策和學習,例如使用卷積神經網路(CNN)用於影像處理、循環神經網路(RNN)進行序列資料處理,或如自註意力機制(Transformer)等。
- 強化學習:Agent 透過與環境的互動來學習最佳行動策略。除此之外,Agent 的運作原理還包括策略網絡、價值網絡、訓練和優化,以及探索與利用等。例如在遊戲場景下,策略網絡可以輸入遊戲狀態,然後輸出行動機率分佈;價值網絡能夠估計狀態價值;Agent 則可以透過與環境互動不斷強化學習演算法以優化策略和價值網絡,輸出更完美的結果。
總之,AI-Agents 是一種能夠理解、決策和行動的智慧實體,它們可以在各種領域中發揮重要作用,包括遊戲領域。 OpenAI 核心技術人員Lilian Weng 撰寫的《LLM Powered Autonomous Agents 》非常全面的介紹了AI-Agents 原理,其中,文中提到一個非常有趣的實驗:Generative Agents。
Generative Agents (簡稱GA)的靈感來自《模擬市民》遊戲,其使用LLM 技術產生了25 個虛擬角色,每個角色都由LLM 支援的Agent 控制,在沙盒環境中生活和互動。 GA 的設計很聰明,它將LLM 與記憶、規劃和反思功能結合在一起,這使得Agent 程式可以根據先前的經驗來做出決策,並與其他Agent 互動。
文章詳細介紹了Agent 如何基於策略網絡、價值網絡以及和環境的互動來不斷訓練和優化決策路徑。
原理如下:其中,記憶流(Memory Stram)是一個長期記憶模組,記錄了Agent 的所有互動經驗。檢索模型(Retrieve)根據相關性、新鮮度和重要性來提供經驗(Retrived Memories),幫助Agent 做出決策(Plan)。反思機制(Reflect)則總結過去的事件,指導Agent 未來的行動。 Plan 和Reflect 則共同幫助Agent 將反思和環境資訊轉換為實際行動Act 。
這種有趣的實驗向我們展示了AI Agent 的能力,例如產生新的社交行為、資訊傳播、關係記憶(例如兩個虛擬角色繼續討論主題)和社交活動的協調(例如舉辦聚會並邀請其他虛擬角色)等等。總之,AI-Agent 是一個非常有趣的工具,在遊戲中的應用也值得深入探索。
02 科技趨勢
2.1 AI 賽道趨勢
ABCDE 的投研合夥人LaoBai曾總結矽谷創投圈對AI 下一步發展的判斷:
- 沒有垂類模型,只有大模型+ 垂類應用;
- 邊緣設備例如手機端的數據可能會是個壁壘,基於邊緣設備的AI 可能也是個機會;
- Context 的長度未來可能引發質變(現在用向量資料庫作為AI 記憶體,但上下文長度還不夠)。
即從行業普通發展規律來看,因為大型通用模型模式太重,且具備較強的普適性,所以沒必要在大型通用模型領域不斷造輪子,而應更多側重於將大型通用模型應用於垂類領域。
同時,邊緣設備指通常不依賴雲端運算中心或遠端伺服器,而是在本地進行資料處理和決策的終端設備。因為邊緣設備的多樣性,所以如何將AI Agent 部署到設備上運行並合理獲取設備數據就是一個挑戰,但同時也是新的機會。
最後,關於Context 的問題也備受關注。簡單來說,在LLM 背景下的Context 可以理解為資訊數量,Context 長度可以理解為資料有多少維度。假如現在有一個電子商務網站的大數據模型,該模型用於預測用戶購買某個產品的可能性。在這種情況下,Context 可以包括使用者的瀏覽記錄、購買記錄、搜尋記錄、使用者屬性等資訊。 Context 長度則指特徵資訊疊加的維度,例如上海30 歲男性用戶的競品購買歷史,疊加最近購買的頻率,再疊加最近的瀏覽記錄等。 Context 長度的增加可以幫助模型更全面地理解使用者購買決策的影響因素。
目前的共識認為,雖然目前使用向量資料庫作為AI 的記憶體使得Context 長度不夠,但未來Context 長度會發生質的變化,而後LLM 模型可以尋求更高級的方法來處理和理解更長、更複雜的Context資訊.進一步湧現更多超出想像的應用場景。
2.2 AI Agent 趨勢
Folius Ventures總結AI Agent 在遊戲賽道中的應用模式,如下圖:
圖中的1 是LLM 模型,其主要負責將使用者意圖從傳統的鍵盤/ 點擊輸入轉換成自然語言輸入,降低使用者進入門檻。
圖中的2 是整合了AI Agent 的前端Dapp,為使用者提供功能服務的同時,也可以從終端收集使用者習慣和資料。
圖中的3 是各類AI Agent,可直接以應用內功能、Bot 等形式存在。
總的來說,AI Agent 作為基於程式碼的工具,可以充當Dapp 擴展應用功能的底層程式以及平台的成長催化劑,即連結大模型和垂類應用的中間件。
從使用者場景來說,最有可能整合AI Agent 的Dapp 大概率是足夠開放的Social app, Chatbot 和遊戲;或者把現有Web2 流量入口透過AI Agent 改造成更簡便親民的AI+web3 入口;即產業內一直在探討的降低Web3 的使用者門檻。
基於產業發展規律,AI Agent 所處的中間件層往往會成為一個高度競爭的賽道,幾乎沒有護城河。所以,AI Agent 除了不斷的提升體驗以匹配B2C 的需求以外,可以透過製造網路效應或創造使用者黏性的來提升自己的護城河。
03 賽道地圖
AI 在Web3 遊戲領域的應用已經出現了多種不同嘗試,這些嘗試可以分為以下幾個類別:
- 通用模型:有些專案專注於建立通用AI 模型,針對Web3 專案的需求,找到適用的神經網路架構和通用模型。
- 垂直應用:垂類應用程式旨在解決遊戲中的特定問題或為提供特定服務,通常以Agent、Bot 和BotKits 的形式出現。
- Generative AI 應用:大模型對應的最直接的應用就是內容生成,而遊戲賽道本身就是內容產業,所以遊戲領域的Generative AI 應用非常值得關注。從自動生成虛擬世界中的元素、角色、任務或故事情節等,再到自動生成遊戲策略、決策甚至是遊戲內生態的自動演變都成為了可能,使遊戲更具多樣性和深度。
- AI 遊戲:目前,已經有許多遊戲整合了AI 技術,應用場景各不相同,後文將舉例說明。
3.1 一般大模型
目前,Web3 已經有針對經濟模型設計和經濟生態發展的模擬模型了,例如QTM 量化代幣模型。 Outlier Venture 的Dr. Achim Struve 在ETHCC 的演講中提到一些經濟模型設計的觀點。例如考慮到經濟系統的穩健型,專案方可以透過LLM 模型創建一個數位雙胞胎Digital Twin,對整個生態系統進行1:1 的模擬。
下圖的QTM(量化代幣模型)就是一個AI 驅動的推理模型。 QTM 採用了10 年的固定模擬時間,每個時間步長為一個月。在每個時間步長的開始,代幣會被排放到生態系統中,因此模型中有激勵模組、代幣歸屬模組、空投模組等。隨後,這些代幣將被投放到幾個元桶(meta buckets)中,從這些元桶中再次進行更細化的廣義效用再分配。然後,從這些效用工具中定義獎勵支付等。還有像鏈下業務方面,這也考慮了業務的一般資金狀況,例如可以進行銷毀或回購,還可以衡量用戶採用率或定義用戶採用情況。
當然,模型的輸出品質取決於輸入質量,所以在使用QTM 之前,必須進行充分的市場研究,以獲取更準確的輸入資訊。不過QTM 模型已經是AI 驅動模型在Web3 經濟模型裡非常落地的應用了,也有許多專案方基於QTM 模型做操作難度較低的2C/2B 端應用,降低專案方的使用門檻。
3.2 垂類應用Agent
垂類應用主要以Agent 的形式存在,Agent 可能是Bot、BotKits、虛擬助理、智慧決策支援系統、各類自動化資料處理工具等等不同的形式。一般來說,AI Agent 拿OpenAI 的通用模型為底層,結合其他開源或自研技術,如文字轉語音(TTS)等,並加入特定的資料進行FineTune(機器學習和深度學習領域中的一種訓練技術,主要目的是將一個已經在大規模資料上預先訓練過的模型進一步優化),以創建在某一特定領域表現優於ChatGPT 的AI Agent。
目前Web3 遊戲賽道應用最成熟的是NFT Agent。遊戲賽道的共識是NFT 一定是Web3 遊戲的重要組成部分。
隨著以太坊生態系統中關於元資料管理技術的發展,可程式化的動態NFTs 出現了。對於NFT 的創建者而言,它們可以透過演算法使NFT 功能更靈活。對使用者而言,使用者與NFT 之間可以有更多的互動,產生的互動資料更是成為了一種資訊來源。 AI Agent 則可以優化互動過程,並擴展互動資料的應用場景,為NFT 生態系統注入了更多的創新和價值。
案例一:例如Gelato 的開發框架允許開發者自訂邏輯,根據鏈下事件或特定時間間隔來更新NFT 的元資料。 Gelato 節點將在滿足特定條件時觸發元資料的更改,從而實現鏈上NFT 的自動更新。例如,這種技術可以用於從體育API 獲取即時比賽數據,並在特定條件下,例如運動員贏得比賽時,自動升級NFT 的技能特徵。
案例二:Paima 也為Dynamic NFT 提供了應用程式類別Agent。 Paima 的NFT 壓縮協定在L1 上鑄造了一組最小的NFT,然後根據L2 上的遊戲狀態進行演化,為玩家提供更具深度和互動性的遊戲體驗。例如NFT 可以根據角色的經驗值、任務完成狀況、裝備等因素而改變。
案例三:Mudulas Labs 是非常知名的ZKML 項目,在NFT 賽道也有佈局。 Mudulas 推出了NFT 系列zkMon,讓透過AI 產生NFT 並發佈至鏈上,同時產生一個zkp,使用者可以透過zkp 是否會產生自對應的AI 模型來檢查自己的NFT。更全面的資訊可以參考:Chapter 7.2: The World’s 1st zkGAN NFTs。
3.3 Generative AI 應用
前文提到,因為遊戲本身就是內容產業,AI-Agent 能夠在短時間內、低成本地產生大量內容,包括創造具有不確定性、動態的遊戲角色等等。所以Generative AI 非常適合在遊戲應用。目前,在遊戲領域中Generative AI 的應用可以總結為以下幾種主要類型:
- AI 產生遊戲角色類:例如和AI 對戰,或由AI 負責模擬和控制遊戲中的NPC,甚至直接用AI 生成角色等。
- AI 產生遊戲內容類:直接由AI 各種內容,如任務、故事情節、道具、地圖等。
- AI 產生遊戲場景類別:支援用AI 自動產生、最佳化或擴展遊戲世界的地形、景觀和氛圍等。
3.3.1 AI 生成角色
- 案例一:MyShell
MyShell 是一個Bot 創建平台,使用者可以根據自己的需求,創建專屬Bot 用於聊天、練習口語、玩遊戲、甚至尋求心理諮詢等等。同時,Myshell 使用了文字轉語音(TTS)技術,只需幾秒鐘的語音樣本,就可以模仿任何人的聲音自動建立Bot。除此之外,MyShell 使用了AutoPrompt,允許使用者僅透過描述自己的想法去給LLM 模型發出指令,為私人大型語言模型(LLM)打下了基礎。
有Myshell 的用戶表示,其語音聊天功能非常流暢,回應速度比GPT 的語音聊天還要快,而且還有Live2D。
- 案例二:AI Arena
AI Arena 是一款AI 對戰遊戲,使用者可以使用LLM 模型不斷的訓練自己的對戰精靈(NFT),然後將訓練好的對戰精靈送到PvP/PvE 戰場對戰。對戰模式和任天堂明星大亂鬥類似,但透過AI 訓練增加了更多的競技趣味性。
Paradigm 領投了AI Arena,目前公測階段已開始,玩家可以免費進入遊戲,也可以購買NFT 提升訓練強度。
- 案例三:鏈上西洋棋遊戲Leela vs the World
Leela vs the World 是Mudulas Labs 開發的國際象棋遊戲。遊戲裡遊戲雙方是AI 和人,棋局情況放在合約裡。玩家透過錢包進行操作(與合約互動)。而AI 讀取新的棋局情況,做出判斷,並為整個計算過程產生zkp ,這兩步都是在AWS 雲上完成,而zkp 交由鏈上的合約驗證,驗證成功後調用棋局合約「下棋」。
3.3.2 AI 生成遊戲內容
- 案例一:AI Town
AI Town 是a16z 與其投資組合公司Convex Dev 的合作成果,靈感來自史丹佛大學的《Generative Agent》論文。 AI Town 是一座虛擬城鎮,城鎮內的每個AI 都可以根據互動和經驗建立自己的故事。
其中,使用Convex 後端無伺服器框架、Pinecone 向量儲存、Clerk 身份驗證、OpenAI 自然語言文字產生以及Fly 部署等技術堆疊。除此之外,AI Town 全部開源,支援遊戲內開發者自訂各種元件,包括特徵資料、精靈表、Tilemap 的視覺環境、文字生成提示、遊戲規則和邏輯等等。除了一般玩家可以體驗AI Town,開發者還可以使用原始碼在遊戲內甚至遊戲外開發各種功能,這種靈活性使AI Town 適用於各種不同類型的應用。
所以, AI Town 本身就是一個AI 生成內容類遊戲,但也是一個開發生態,甚至是一個開發工具。
- 案例二:Paul
Paul 是一個AI 故事生成器,其專門為全鏈遊戲提供了一個AI 故事生成並直接上鍊的解決路徑。其實作邏輯是為LLM 輸入了一大堆先驗規則,然後玩家可以自動依照規則產生次生內容。
目前有遊戲Straylight protocol 使用Paul Seidler 發行了遊戲,Straylight 是一款多人的NFT 遊戲,核心玩法就是全鏈遊戲版本的“Minecraft”,玩家可以自動Mint NFT,然後根據模型輸入的基本規則構造自己的世界。
3.3.3 AI 生成遊戲場景
- 案例一:Pahdo Labs
Pahdo Labs 是一家遊戲開發工作室,目前正在開發Halcyon Zero,這是一款基於Godot 引擎構建的動漫奇幻角色扮演遊戲和線上遊戲創建平台。遊戲發生在一個空靈的幻想世界中,以作為社交中心的繁華城鎮為中心。
這款遊戲非常特別的地方在於,玩家可以使用遊戲方提供的AI 創作工具快速創作更多的3D 效果背景以及把自己喜歡的角色帶入遊戲,真正為大眾遊戲UGC 提供了工具和遊戲場景。
- 案例二:Kaedim
Kaedim 針對遊戲Studio 開發了一個基於Generative AI 的3D model generation 工具,可以快速的幫助遊戲Studio 批量生成符合他們需求的遊戲內3D 場景/ 資產。目前Kaedim 的通用產品仍在開發中,預計2024 年開放給遊戲Studio 使用。
Kaedim 產品的核心邏輯和AI-Agent 是完全相同的,使用通用大模型為基礎,然後團隊內部的藝術家會不斷輸入好的數據,然後給Agent 的輸出進行反饋,不斷的通過機器學習訓練這個Model,最後讓AI-Agent 可以輸出符合要求的3D 場景。
04 總結
在本文中,我們對AI 在遊戲領域的應用進行了詳細的分析和總結。總的來說,未來通用模型以及Generative AI 在遊戲中的應用一定會出現明星獨角獸項目。垂類應用雖然護城河較低,但先發優勢強,如果能靠先發優勢製造網路效應和提升用戶黏性,則想像空間巨大。除此之外,生成式AI 天然適合遊戲這個內容產業,目前已經有非常多的團隊在嘗試GA 在遊戲的應用,這個週期就非常有可能出現應用GA 的爆款遊戲。
除了文中提到的一些方向,未來還有其他的探索角度。比如:
(1) 數據賽道+ 應用層:AI 數據賽道已經孕育出了一些估值達數十億美元的獨角獸項目,而數據+ 應用層的連動同樣充滿想像空間。
(2) 與Socialfi 結合:例如提供創新的社交互動方式;用AI Agent 優化社群身分認證、社群治理;或更聰明的個人化推薦等。
(3) 隨著Agent 的自動化與成熟化,之後Autonomous World 的主要參與者到底是人還是Bot?鏈上的自治世界是否有可能能像Uniswap 一樣,80%+ 的DAU 都是Bot?如果是,那結合Web3 治理概念的治理Agent 也同樣值得探索。
參考文獻
https://messari.io/report/application-scaling-botkits?referrer=research-reports
https://mirror.xyz/1kx.eth/9lMkZYQgrO2G6ei2dQFU6RmulsPHuVxQETK3fATtd9o
https://mirror.xyz/1kx.eth/oBuaEp5jgGbe2gCsa6Z-_mLAeMRUhsIdZsaScHQNXS0
https://foresightnews.pro/article/detail/43941
https://foresightnews.pro/article/detail/42157
https://foresightnews.pro/article/detail/39058
https://foresightnews.pro/article/detail/40421
https://foresightnews.pro/article/detail/39894
https://docsend.com/view/4rm9mp56ypr5ae6p