鏈上AI智能體:架構、範例和值得關注的項目

作者:accelxr,1KX;翻譯:0xjs@金色財經

目前生成式模型的主要目的是內容創建和資訊過濾。然而,最近關於AI智能體(使用外部工具完成用戶定義目標的自主參與者)的研究和討論表明,如果為AI提供類似於1990年代互聯網的經濟通道,AI可能會獲得實質性的解鎖。

為此,智能體需要對他們可以控制的資產進行代理,因為傳統金融系統不是為他們設定的。

這就是加密發揮作用的地方:加密提供了一種具有快速結算的、數位化的支付和所有權層,特別適合建立AI 智能體。

本文我將向你介紹智能體和智能體架構的概念,研究中的範例如何證明智能體具有超越傳統LLM的新興屬性,以及圍繞基於加密的智能體構建解決方案或產品的項目。

什麼是智能體

AI 智能體是LLM 驅動的實體,能夠規劃並採取行動,在多次迭代中實現目標。

智能體架構由單一隻能或多個智能體組成,共同解決問題。

通常,每個智能體都被賦予個性並可以使用各種工具,這些工具將幫助他們獨立或作為團隊的一部分完成工作。

智能體架構與我們今天通常與LLM 互動的方式不同:

零次提示是大多數人與這些模型互動的方式:你輸入提示,LLM 根據其預先存在的知識產生回應。

在智能體架構中,你初始化目標,LLM 將其分解為子任務,然後它遞歸地提示自己(或其他模型)自主完成每個子任務,直到達到目標。

單智能體架構與多智能體架構

單智能體架構:一種語言模型自行執行所有推理、規劃和工具執行。沒有其他智能體的回饋機制,但人類可以選擇向智能體提供回饋。

多智能體架構:這些架構涉及兩個或多個智能體,其中每個智能體可以使用相同的語言模型或一組不同的語言模型。智能體可以使用相同的工具或不同的工具。每個智能體通常都有自己的角色。

  • 垂直結構:一個智能體充當領導者,其他智能體向其報告。這有助於組織小組的輸出。

  • 水平結構:一個關於任務的大型小組討論,每個智能體都可以看到其他訊息並自願完成任務或呼叫工具。

智能體架構:設定檔

智能體具有配置或個性,它們將角色定義為提示,以影響LLM 的行為和技能。這在很大程度上取決於特定的應用程式。

可能許多人今天已經將其用作提示技術:“你是營養專家。為我提供一份膳食計劃……”。有趣的是,為LLM 提供角色可以提高其輸出與基線相比。

設定檔可以透過以下方法製作:

  • 手工製作:由人類創建者手動指定的配置;最靈活,但也耗時。

  • LLM 產生:使用LLM 產生的設定文件,該設定檔包含圍繞組成和屬性的規則集+(可選)少量樣本範例。

  • 資料集對齊:設定檔是根據現實世界的人員資料集產生的。

智能體架構:記憶體

智能體的記憶儲存從環境中感知到的訊息,並利用這些資訊制定新的計畫或行動。記憶使智能體能夠根據其經驗自我進化和行事。

  • 統一記憶:類似於透過情境學習/透過持續提示實現的短期記憶。所有相關記憶都會在每次提示中傳遞給智能體。主要受上下文視窗大小的限制。

  • 混合:短期+長期記憶。短期記憶是當前狀態的暫時緩衝區。反射或有用的長期資訊永久儲存在資料庫中。有幾種方法可以做到這一點,但常見的方法是使用向量資料庫(將記憶編碼為嵌入並儲存;回憶來自相似性搜尋)

  • 格式:自然語言、資料庫(例如,經過微調以理解SQL 查詢的SQL)、結構化清單、嵌入

智能體架構:規劃

複雜任務解構為更簡單的子任務以單獨解決。

無回饋規劃:

在這種方法中,智能體在採取行動後不會收到影響未來行為的回饋。一個例子是思路鏈(Chain of Thought,CoT),鼓勵LLM 在提供答案時表達其思考過程。

  • 單路徑推理(例如零次CoT)

  • 多路徑推理(例如自洽CoT,其中產生多個CoT 線程並使用最高頻率的答案)

  • 外部規劃器(例如規劃域定義語言)

帶回饋的規劃:

根據外部回饋迭代細化子任務

  • 環境回饋(例如遊戲任務完成訊號)

  • 人為回饋(例如徵求用戶的回饋)

  • 模型回饋(例如徵求另一個LLM 的回饋- 眾包)

智能體架構:行為(Action)

Action負責將智能體的決策轉化為具體結果。

行為目標有多種可能的形式,例如:

  • 任務完成(例如在Minecraft 中製作鐵鎬)

  • 通訊(例如與另一個智能體或人類分享資訊)

  • 環境探索(例如搜尋自己的行為空間並學習自己的能力)。

行為的產生通常來自記憶回憶或計畫遵循,行為空間由內部知識、API、資料庫/知識庫以及對自身的使用外部模型組成。

智能體架構:能力獲取

智能體要在動作空間內正確執行動作,就必須具備特定任務的能力。主要有兩種方法可以實現這一點:

  • 透過微調:在人工註釋、LLM 生成或真實世界範例行為資料集上訓練智能體。

  • 無需微調:可以透過更複雜的提示工程和/或機制工程(即在進行反覆試驗時結合外部回饋或經驗累積)使用LLM 的先天能力。

文獻中的智能體例子

生成式智能體:人類行為的互動模擬:在虛擬沙箱環境中實例化生成式智能體,顯示多智能體系統具有突發社交行為。從即將到來的情人節派對的單一使用者指定提示開始,智能體會在接下來的兩天內自動發送邀請、結識新朋友、相互約會,並協調在合適的時間一起參加派對。你可以使用a16z AI Town的實作親自嘗試。

描述解釋計畫選擇(DEPS) :第一個可以完成70 多項Minecraft 任務的零樣本多任務智能體。

Voyager:Minecraft 中第一個由LLM 驅動的體現終身學習的智能體,它可以不斷探索世界,獲得各種技能,並在無需人工幹預的情況下做出新發現。根據反覆試驗的回饋不斷改進其技能執行程式碼。

CALYPSO:為遊戲「龍與地下城」設計的智能體,可以協助地下城主創作和說故事。它的短期記憶建立在場景描述、怪物資訊和先前的總結之上。

Minecraft中的幽靈(GITM) :Minecraft 中能力一般的智能體,取得鑽石的成功率為67.5%,遊戲中所有物品的完成率為100%。

SayPlan :基於LLM 的機器人大規模任務規劃,使用3d 場景圖形表示,展示了從抽象和自然語言指令為機器人執行長期任務規劃的能力。

HuggingGPT:根據使用者提示使用ChatGPT 進行任務規劃,根據Hugging Face 上的描述選擇模型,並執行所有子任務,在語言、視覺、語音和其他具有挑戰性的任務中取得了令人印象深刻的成果。

MetaGPT:接受輸入並輸出使用者故事/ 競爭分析/ 需求/ 資料結構/ API / 文件等。在內部,有多個智能體構成軟體公司的各種功能。

ChemCrow:一種LLM 化學智能體,旨在使用18 種專家設計的工具完成有機合成、藥物發現和材料設計等任務。自主規劃和執行驅蟲劑、三種有機催化劑的合成,並指導發現一種新型髮色團。

BabyAGI :使用OpenAI 和向量資料庫(例如Chroma 或Weaviate)來建立、確定優先順序和執行任務的通用基礎設施。

AutoGPT:用於啟動LLM 智能體的通用基礎架構的另一個範例。

Crypto中的智能體範例

(注意:並非所有範例都是基於LLM 的+ 有些可能更鬆散地基於智能體概念)

來自Ritualnet的FrenRug:基於GPT-4 土耳其地毯推銷員遊戲{ https:// aiadventure.spiel.com/carpet }。 Frenrug 是一位經紀人,任何人都可以嘗試說服他購買他們的Friend.tech Key。每個用戶訊息都會傳遞給由不同Infernet 節點運行的多個LLM。這些節點在鏈上響應,並由LLM 投票決定智能體是否應該購買提議的Key。當有足夠的節點回應時,投票就會聚合,監督分類器模型會確定操作並在鏈上傳遞有效性證明,從而可以驗證多項分類器的鏈下執行情況。

Gnosis上使用autonolas的預測市場智能體:AI 機器人本質上是AI 服務的智能合約包裝器,任何人都可以透過付款和提問來調用它。服務會監控請求、執行任務並在鏈上返回答案。這種AI 機器人基礎設施已透過Omen 擴展到預測市場,其基本概念是智能體將積極監控和押注新聞分析的預測,最終得出更接近真實賠率的總結預測。智能體在Omen 上搜尋市場,自主向「機器人」支付有關該主題的預測,並利用市場進行交易。

ianDAOs GPT<>Safe示範:GPT 使用syndicateio交易雲端API在自己Base鏈上的Safe 多重簽名錢包中自主管理USDC。你可以與它交談,並就如何最好地利用其資本提出建議,它可能會根據你的建議進行分配。

遊戲智能體:這裡有多個想法,但簡而言之,虛擬環境中的AI 智能體既是同伴(例如《Skyrim》中的AI NPC),又是競爭對手(例如一群胖乎乎的企鵝)。智能體可以自動執行收益策略,提供商品和服務(例如:店主、旅行商人、老練的生成式任務提供者),或是像在Parallel Colony和Ai Arena中的半可玩角色。

Safe守護天使(Guardian Angels):使用一組AI 智能體來監控錢包並防禦潛在威脅,以保護用戶資金並提高錢包安全性。特性包括在發生異常或駭客攻擊時自動撤銷合約權限和提取資金。

Botto:雖然Botto 是一個定義較為寬泛的鏈上智能體範例,但它展示了自主鏈上藝術家的概念,創作的作品由代幣持有者投票並在SuperRare 上拍賣。人們可以想像採用多模態智能體架構的各種擴充。 —

一些值得關注的智能體項目

(注意:並非所有項目都是基於LLM 的+ 有些可能更鬆散地基於智能體概念)

AIWay Finder——協議、合約、合約標準、資產、功能、API 功能、例程+ 路徑的去中心化知識圖譜(即尋路者智能體可以導航的區塊鏈生態系統虛擬路線圖)。使用者將因識別智能體使用的可行路徑而獲得獎勵。此外,你可以鑄造包含角色設定和技能啟動的外殼(即智能體),隨後可以將其插入尋路者知識圖譜。

Ritualnet-如上文frenrug 範例所示,Ritual infernet 節點可用來設定多智能體架構。節點監聽鏈上或鏈下請求,並提供可選證明的輸出。

Morpheus-個人通用AI 的點對點網絡,可以代表使用者執行智慧合約。這可用於web3 錢包和tx 意圖管理、透過聊天機器人介面進行資料解析、dapps 和合約的推薦模型,以及透過連接應用程式和使用者資料的長期記憶擴展智慧體操作。

Dain Protocol-探索在Solana 上部署智能體的多種用例。最近演示了一個加密交易機器人的部署,該機器人可以提取鏈上和鏈下資訊以代表用戶執行(例如,如果拜登輸了,就出售BODEN)

Naptha——智能體編排協議,具有用於簽約智能體的鏈上任務市場、編排任務的操作員節點、支援跨不同節點非同步訊息傳遞的LLM 工作流程編排引擎以及用於驗證執行的工作流程證明系統。

Myshell——類似於http:// character.ai的AI 角色平台,創作者可以在其中將智能體配置和工具貨幣化。多模態基礎設施,包含一些有趣的範例智能體,包括翻譯、教育、陪伴、編碼等。包含簡單的無程式碼智慧體創建和用於組裝AI 小部件的更高級的開發人員模式。

AI Arena-一款具有競爭力的PvP 格鬥遊戲,玩家可以購買、訓練和對抗支援AI 的NFT。玩家透過模仿學習訓練他們的智能體NFT,其中AI 透過學習玩家行為的相關機率來學習如何在不同的地圖和場景中玩遊戲。經過訓練後,玩家可以派出他們的智能體參加排名戰以獲得代幣獎勵。不是基於LLM,但仍然是智能體遊戲可能性的一個有趣例子。

Virtuals Protocol——一種用於建構和部署多模態智能體到遊戲和其他線上空間的協定。當今虛擬的三個主要原型包括IP 角色鏡像、特定功能智慧體和個人替身。貢獻者向虛擬貢獻資料和模型,驗證者充當守門人。存在一個經濟層面的激勵機制來促進開發和貨幣化。

Brianknows-為使用者提供使用者介面,以便與智能體進行交互,智能體可以執行交易、研究特定於加密貨幣的資訊並及時部署智能合約。目前支援100 多個整合中的10 多個操作。最近的一個例子是讓智能體使用自然語言代表使用者在Lido 中質押ETH。

Autonolas-提供輕量級本地和基於雲端的智慧體、共識營運的去中心化智能體和專業智能體經濟。突出的例子包括DeFi 和基於預測的智能體、由AI 驅動的治理代表和智能體對智能體(agent-to-agent)工具市場。提供用於協調和激勵智能體操作的協定+ OLAS 堆棧,這是一個供開發人員建構可共同擁有的智能體的開源框架。

Creator.Bid-提供使用者與X 和Farcaster 即時API 連結的社群媒體角色智能體。品牌可以啟動基於知識的智能體,在社群平台上執行與品牌一致的內容。

Polywrap-提供各種基於智能體的產品,例如Indexer(Farcaster 的社交媒體智能體)、AutoTx(使用Morpheus 和flock.io構建的規劃和交易執行智能體)、predictionprophet.ai(有Gnosis 和Autonolas 的預測智能體)和fundpublicgoods.ai (用於撥款資源分配的智能體)。

驗證-由於經濟流動將由智能體指導,因此輸出驗證將非常重要(以後的文章將對此進行詳細介紹)。驗證方法包括來自Ora Protocol,來自如Modulus Labs+Giza+ EZKL團隊的zkML、博弈論解決方案以及像TEE 這樣的基於硬體的解決方案。

對於鏈上智能體的一些想法

  • 可擁有、可交易、代幣門控的智能體,可執行各種類型的功能,從陪伴到金融應用,

  • 可以代表你辨識、學習並參與遊戲經濟的智能體;也可以作為協作、競爭或完全模擬環境中的玩家的自主智能體。

  • 可以模擬真實人類行為的智能體,用於收益機會

  • 多智能體管理的智慧錢包,可作為自主資產管理者

  • AI 管理的DAO 治理(例如代幣委託、提案創建或管理、流程改進等)

  • 使用web3 儲存或資料庫作為可組合的向量嵌入系統,用於共享和永久記憶體狀態

  • 本地運作的智能體,參與全域共識網絡,執行使用者定義任務

  • 現有和新協議互動和API 的知識圖譜

  • 自主守護者網路、多重簽章安全、智慧合約安全與功能增強

  • 真正自主的投資DAO(例如,使用藝術史學家、投資分析師、數據分析師和degen智能體角色的收藏家DAO)

  • 代幣經濟學和合約安全模擬與測試

  • 一般意圖管理,特別是在加密使用者體驗(如橋接或DeFi)的情況下

  • 藝術或實驗項目

吸引下一個十億用戶

正如Varaint Fund聯合創始人Jesse Walden最近所言,自主智能體是區塊鏈使用方式的進化,而不是革命:我們已經有了協議任務機器人、狙擊機器人、MEV 搜尋器、機器人工具包等。智能體只是這一切的延伸。

加密的許多領域都是以有利於智能體執行的方式構建的,例如完全鏈上游戲和DeFi。假設LLM 的成本相對於任務性能呈下降趨勢+ 創建和部署智能體的可訪問性增加,很難想像一個AI智能體不會主宰鏈上交互並成為加密的下一個十億用戶的世界。

閱讀材料:

AI Agents That Can Bank Themselves Using Blockchains

The new AI agent economy will run on Smart Accounts

A Survey on Large Language Model based Autonomous Agents (I used this for identifying the taxonomy of agentic architectures above, highly recommend)

ReAct: Synergizing Reasoning and Acting in Language Models

Generative agents: Interactive simulacra of human behavior

Reflexion: Language Agents with Verbal Reinforcement Learning

Toolformer: Language Models Can Teach Themselves to Use Tools

Describe, Explain, Plan and Select: Interactive Planning with Large Language Models Enables Open-World Multi-Task Agents

Voyager: An Open-Ended Embodied Agent with Large Language Models

LLM Agents Papers GitHub Repo

原文連結

Total
0
Shares
Related Posts