文章來源:新智元
編輯:Aeneas 桃子
一位外國up主,用ChatGPT給AI智能體注入了自我意識。產生「生命」的勞拉覺醒了,開始自己在「古墓麗影」中闖關。
如果遊戲角色被注入生命,電子遊戲會發展成什麼樣?
曾經,這是不少人的暢想,而如今,隨著AI智能體的發展,這種想像已經開始走入現實。
最近,一位YouTube作者Foxmaster製作了一個經典遊戲「古墓麗影」的原版視頻。
而其中的女主角勞拉,居然是一個能控制自己角色的AI智能體
可以說,利用機器視覺、定位、物體識別、動畫、文本和語音等各種AI工具,Foxmaster為遊戲角色注入了數字生命。
就在前幾天,爆火AI社區的斯坦福智能體小鎮正式開源。 25個各具個性的AI智能體,在「西部世界」一般的沙盒虛擬城鎮中生活、上班、交友。
所以,或許這就是電子遊戲的未來?
「古墓麗影」女主有了意識
構建可以玩遊戲的虛擬AI,這個概念已經很常見。不過,Formaster想做的,是讓這個角色如同真人一樣。
因此,他選擇了「古墓麗影」這款遊戲,遊戲主角勞拉是一個人物性格鮮明、定義明確的角色。
而Formaste希望,這種個性會對遊戲的最終結局產生影響。
如何讓這個AI智能體Lara Croft在遊戲中真正產生自我意識?
Formaster經過以下幾個步驟的探索,終於成功了。
學習遊戲規則
首先第一步,叫她學會遊戲規則。 「古墓麗影」已經給出了教程,解釋了所有的遊戲控製過程。
作者讓Lara按照給出的方式去練習,像人類玩家一樣完成各個階段的教程。
教程在Lara離開泳池時結束,所以可以在那時重啟程序,做出改進。
開始時,改進Lara非常困難。
她有時會出現混亂,在地圖中隨意走動,甚至有時候會卡在菜單欄中,一遍遍盯著她的指南針。
為了解決這個問題, 作者在一台虛擬機上,重新調整了主時鐘,將游戲進程加速了40倍。這個辦法起作用力,AI智能體終於在相對不錯的時間內,完成了教程。
然而,還存在一個問題:Lara經常卡在一個位置,而且每個關卡都是由靜態元素組成,因此只有一條優化路徑。
這會導致她只知道不走哪些路徑,而不是想出更全面的方法來解題。但作者希望的是,Lara學會自己去發掘探險過程。
考慮到Lara唯一掌握的知識,僅僅是每道關卡顯示的屏幕上的內容,作者觀察了從未玩過遊戲的人類玩家的行為。
有的人會看完整個教程,有的人先會探索周圍的環境,而這些選擇的差異,就是由不同人的「個性」決定的。
而Lara需要學習的,恰恰就是這種態度。
識別角色
為了給AI建立與Lara的聯繫,就需要讓AI明白,她是一堆像素。人類玩家進入遊戲後,一下子有了這樣的意識。
對此,作者從各個角度,錄製了24個小時,Lara朝著不同方向活動的視頻,以便AI智能體能夠識別任何給定角色。
就像自動駕駛汽車一樣,能夠以每秒30幀速度拍攝24小時視頻,得到2592000張參考圖像,以識別道路標誌。
首先,作者跟踪頭部主要像素,然後是身體主要像素,來選擇相關區域。
為了確保Lara出現在每張圖像中,作者要求程序去識別那些不包含任何突出顯示的圖片。
當Lara佔據整個屏幕時,或當一個二維物體擋在她面前,作者使用AI視覺捕獲來幫助識別Lara,結果非常準確,足以識別屏幕上的角色。
環境互動
能夠識別Lara後,需要讓AI與環境互動。
整個遊戲環境都是由同樣的區塊組成,作者將其導入到立方體上,然後從各個角度捕獲環境,再運行識別過程,這樣AI智能體就能識別出環境,就像人類玩家解釋圖像的過程。
紅色突出顯示的區域是,未能識別的紋理。但是,AI仍舊缺乏想去某個地方的意識,還需要知道自己距離周圍環境的距離。
有趣的是,這些未能識別的區域,通常是遠離Lara的位置,或被其他2D物體遮擋的位置。
當我們觀察人類玩家的行為,看到這張圖像後,我們能夠立即明白,箭頭所指向區域是一個入口。
我們可能不知道下一個房間的大小,但我們知道這是存在的。
但是,這也可能是一種視覺錯覺。當我們去移動,入口區域的紋理與其他地方不同,這是3D空間的特徵。
因此,AI智能體還得學會移動,並進行比較。從計算角度來看,可以使用多個圖像來確定哪些紋理尺寸的變化最小。
這裡可以使用主Polygon的面積來算,它們的變化主要基於彼此之間距離成比例的概率。
想像
現在,AI已經知道自己身在何處了,她必須做出決定,自己下一步要去哪裡。
通過識別紋理,可以讓她到達特定的位置,然而在關卡中導航,需要更簡單的東西。
最快的方法,就是簡化對比度,識別區域中光線的突然變化。但是,人類玩家不一定會去這些地方。
當有多個開口時,AI必須表現出足夠興趣,但不能導致她死亡。
比如,如果一個洞太深,就無法在不抓住周圍壁架的情況下跳下去。假如下面有水存在,倒是有可能值得這種冒險。
人類玩家知道什麼時候可以跳,但Lara的行動方針都是來源於教程,它必須準確估計自己和目標之間有多少個方塊,是否應該聚集自己的動量,以及在放手之前是否應該暫停一下。
總之,她必須像人類玩家一樣,做出準確評估。
如果她提前知道一個洞的大小,就會跑得非常快,這就並不符合我們的期望。
為了讓她多收集環境信息,作者鼓勵AI,如果有疑惑,就應該旋轉相機,收集更多的信息。
但真實情況下,即便如此,AI也可能卡在房間裡。
為了鼓勵她走出房間,作者補充了一些收集規則。
比如,每次遇到在該區域成為優先級前從未見過的紋理時,她都必須以增加屏幕上這種紋理大小的方式來移動。
這樣,她就只能在關卡中前進。因為每個關卡中都有獨特的紋理,解鎖的唯一方式,就是進入下一個關卡。
總之,Lara會不斷分析自己在屏幕上看到的內容——不同表面的紋理,她會移動自己的身體,定義新的興趣點(即目錄中尚未存在的紋理)。
在這個過程中,她會不斷驗證,去尋找丟失的紋理。
運動
然而,即使經過了上述改進,這個AI還是太像個機器人了,行動模式是顯而易見的。
為了改進它,作者再次觀察了人類玩家。
是什麼決定了人類玩家在遊戲中如何行動?就是我們的記憶,我們會記住動作是如何組合的。
因此,這個過程也需要植入到AI中,因為Lara必須意識到她自己的運動能力。
為此,作者把AI每一秒的動作都保存起來,來訓練它,然後添加一條規則,允許它同時執行這些保存的動作。
這樣,AI的動作就變得平滑多了。
另外,因為每個動作的冷卻時間是已知的,就可以防止AI在執行不必要的動作時,仍然處於活動狀態。
在下圖中,火焰重新激活的速度如此之快,需要完成很大的跳躍才能穿過。
幸運的是,這些通道在視覺上被簡化了,很容易識別塊的邊緣。
AI知道,Lara總是會在方塊的第一部分激活時完成正確的跳躍,就像人類玩家理解的一樣。
ChatGPT注入人格
接下來,就需要將Lara的個性灌輸給AI智能體。個性取決於經驗和記憶,這些因素的結合決定了Lara角色。
根據遊戲設定,她是一個著名的考古學家,從不畏懼冒險,願意接受分配的山區任務,甚至不要獎賞,完全出於熱愛。
另外,Lara還特別有錢,剛剛搬進一座豪宅,屋內裝飾非常優雅,屋子裡還有一個訓練室。她還特別擅長教學,游泳,攀爬,耐力非常強。
當冒險途中遇到危險,她能夠保持鎮靜,而且非常Brave,會毫不猶豫幫助同伴。
面對狼群包圍,她用槍準確地射殺,還能用匕首殺死凶險的狼。她唯一拒絕的是,主動強行開鎖。
以上的一切,都是從遊戲設定中,了解到的Lara個性。
接下來,就是以真實的方式去評測她所看到的一切,對此,作者在數據庫中已經編譯Lara的性格特徵。
為了使評測對實際情況有意義,程序需要將游戲圖像與現實生活中可識別的東西相關聯。
對於紋理細節通常較少的圖像,可以通過谷歌逆向圖像搜索進行匹配。
因此,當AI智能體檢測到足夠大的紋理,它就會啟動搜素。
為了識別單詞,作者將整個頁面複製到ChatGPT。然後要求ChatGPT根據出現的次數對其進行分類,再將識別出的單詞添加到列表中。
最後要求ChatGPT根據這些單詞創建一個句子,並且要考慮到Lara個性。
這樣做,就是要ChatGPT去真是地評測,Lara在現實生活中看到的東西。
比如,如果紋理被識別為海獅,ChatGPT能夠將海獅與Lara個性特徵聯繫起來做出評測。
總得來說,Lara智能體的人格是通過ChatGPT使用「Brave」、「友好」或「聰明」等各種屬性設定。
Lara在遊戲中,感知和評測的所有物體都會通過這個人格過濾器,並由Lara根據既定的性格反應出來。
就比如,如上的海豹,Lara會提及海獅化石,或者出色的游泳能力,並不會對其在馬戲團發表言論。
網友:AI智能體讓電子遊戲變成了藝術品
有網友表示,這是讓角色自我發展最酷、最自然的感覺方式之一。當角色能夠活靈活現,你才可以真正體驗到電子遊戲是一件藝術品。
「她說話和分析周圍環境的方式非常可愛。讓AI機器人有能力評測周圍環境,無論它的實際水平如何,都會讓人覺得她是個活生生的人。」
「這太迷人了。她那超然的好奇心和一絲異想天開的想法,與我想像中的Lara的內心獨白驚人地相似。」
有人說,讓我感到驚奇的是,她的對話與她的行為相吻合。
這讓人覺得,寫對話的人工智能和控制角色的人工智能是同一個人。
前不久在斯坦福AI智能體小鎮開源時,網友們就十分激動,覺得AGI已來,各種RPG和模擬類游戲都會很快用上這種技術。
而現在,Foxmaster將ChatGPT、計算機視覺和物體識別的結合,讓電子遊戲變得更有趣了。
或許在未來,電子遊戲角色可以被賦予更深、更靈活的個性,對環境做出更快的反應,以及許多我們無法想像的變化。
參考資料:
https://the-decoder.com/ai-makes-lara-croft-self-aware-in-og-tomb-raider/
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載