撰文:Benj Edwards
來源:Ars Technica
近日,斯坦福大學和谷歌的一組研究人員,包括Joon Sung Park, Joseph C. O’Brien, Carrie J. Cai, Meredith Ringel Morris, Percy Liang 和Michael S. Bernstein,創建了一個類似於《模擬人生》(The Sims)的微型RPG 風格的虛擬世界,其中25 個角色由ChatGPT 和自定義代碼控制,以高度逼真的行為獨立生活。他們在周五發表的預印本學術論文《生成代理:人類行為的交互模擬》(Generative Agents: Interactive Simulacra of Human Behavior)中介紹了他們的實驗。
研究人員寫道:“生成代理醒來,做早餐,然後去工作;藝術家作畫,作家寫作;他們形成意見,互相注意,並發起對話;他們在計劃第二天的工作時會記住並思考過去的日子。”
為了實現這一目標,研究人員在很大程度上依賴於一個用於社會互動的大型語言模型(LLM),特別是ChatGPT API。此外,他們創建了一個架構,用記憶和經驗來模擬思維,然後讓代理在世界範圍內進行互動。而人類也可以與他們互動。
他們寫道:“用戶可以觀察和乾預代理的日常計劃、分享新聞、建立關係和協調小組活動。”
自20 世紀70 年代以來,計算機和電子遊戲已經包含了計算機控制的角色,但它們此前從未能夠模擬具有自然語言複雜性的社交環境。現在,憑藉ChatGPT 等生成式人工智能模型,這種模擬成為可能。雖然該小組的研究不一定是一款“遊戲”,但它可能是未來動態RPG 角色以復雜和意想不到的方式互動的原型。
一位名叫 Dennis Hansen 的推特用戶在回復關於這篇論文的一篇帖子時開玩笑說:“想像一下,殺死一個NPC,回到城市,看到他們的葬禮。”從這項研究來看,這可能不是一個牽強的場景。
Smallville 的生活
為了研究這組人工智能代理,研究人員建立了一個名為“Smallville”的虛擬城鎮,其中包括房屋、咖啡館、公園和雜貨店。為了實現人與人之間的互動,這個虛擬世界以俯視的方式表現出來,使用的是複古風格的像素圖形,讓人想起經典的16 位日本RPG。
Smallville 是一個由25 個不同個體組成的社區,每個個體由一個基本的精靈化身代表。為了捕捉每個代理人的身份以及他們與社區其他成員的聯繫,研究人員創建了一段自然語言描述作為種子記憶。這些描述包括關於每個代理人的職業和與其他代理人的關係的細節。例如,以下是論文中提供的一個此類種子記憶的摘錄:
John Lin 是Willow 市場和藥房的一名藥店店主,他喜歡幫助別人。他一直在尋找方法,使顧客獲得藥物的過程更容易。 John Lin 與身為大學教授的妻子Mei Lin 和學習音樂理論的兒子Eddy Lin 住在一起。 John Lin 非常愛他的家人。
作為一個虛擬環境,Smallville 分為區域和對象。人類用戶可以作為現有或新代理進入世界,用戶和代理都可以通過操作影響對象的狀態。人類用戶還可以通過對話或通過發出指令作為“內心的聲音”與人工智能代理互動。用戶使用自然語言進行交易所,指定代理,或者可以使用內心的聲音來影響代理的行為。
在開發該虛擬世界時,一個特別的挑戰來自於LLM 有限的“內存”。這種內存以“上下文窗口”的形式出現,即ChatGPT 一次可以處理的token(詞塊)的數量。為了克服這些限制,研究人員設計了一個系統,在該系統中,“代理人記憶中最相關的部分”在需要時被檢索和合成。
“代理感知他們的環境,所有的感知都保存在代理的經驗的綜合記錄中,稱為記憶流。基於他們的感知,架構檢索相關的記憶,然後使用這些檢索的行動來決定一個行動。這些檢索到的記憶也被用來形成較長期的計劃,並創造更高層次的反思,這些都被輸入到記憶流中供將來使用。”
有趣的是,當沙盒世界中的人物遇到對方時,他們經常使用ChatGPT 提供的自然語言相互交談。通過這種方式,他們交易所信息並形成關於他們日常生活的記憶。當研究人員將這些基本成分結合在一起並運行模擬時,有趣的事情開始發生。
突發行為
在論文中,研究人員列出了模擬中出現的三種突發行為。這些都不是預先編程的,而是由代理人之間的互動產生的。
這些行為包括“信息擴散”(代理人相互告訴對方信息,並讓其在城鎮中進行社交傳播)、“關係記憶”(記憶代理人之間過去的互動,並在以後提到這些早期事件)和“協調”(與其他代理人一起計劃並參加情人節派對)。
在情人節實驗中,一個名叫Isabella Rodriguez 的人工智能代理在“霍布斯咖啡館”策劃了一個情人節派對,並邀請了朋友和顧客。她在朋友Maria 的幫助下裝飾了咖啡館,並邀請她的暗戀對象Klaus 參加派對。
研究人員寫道:“只從一個用戶指定的概念開始,即一個代理想舉辦一個情人節派對,”“這些代理在接下來的兩天裡自主地傳播派對的邀請,結識新朋友,互相邀約參加派對,並協調在正確的時間一起出現在派對上。”
雖然有12 名代理通過別人聽說了這個派對,但只有5 名代理(包括Klaus 和Maria)最終參加了派對。三名代理說他們太忙了,而另外四位只是單純沒去。這次經歷是一個有趣的例子,說明了在虛擬世界中復雜的社會互動中可能出現的意外情況。
比人類更人性化?
作為研究的一部分,該小組聘請了人類評估員觀看模擬的重播,以衡量人工智能代理根據他們的環境和經驗產生可信行為的程度,包括“可信的計劃、反應和想法”以及“信息擴散、關係形成和代理在社區不同區域的協調”。
研究人員還要求人們用他們所觀看的回放中的代理人的聲音來扮演代理人對採訪問題的回答。有趣的是,他們發現“完整的生成式代理架構”產生的結果比進行角色扮演的人類更可信。
這就導致了其他問題,比如這項技術的道德影響和風險。研究人員提醒說,風險包括形成不適當的“寄生社會關係”,不正確的推斷的影響,加劇與生成式人工智能相關的現有風險,以及在設計過程中過度依賴生成式代理的風險。
為了確保道德和社會責任的部署,研究人員認為,開發人員應該堅持一些原則,如明確披露代理的計算性質,確保價值一致,遵循人類– 人工智能設計的最佳實踐,維護輸入和輸出的審計日誌,以及在研究和設計過程中不取代真正的人類輸入。
為了了解Smallville 的情況,研究人員還通過一個特殊的網站在發布了一個互動演示,但這是論文中描述的“預先計算的模擬重放”,而不是實時模擬。不過,該演示還是很好地說明了在計算機沙盒中運行的一個看似簡單的虛擬世界所能產生的豐富的社會互動。
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載