作者:0XNATALIE
今年下半年以來,AI Agent 的話題熱度持續攀升。起初AI 聊天機器人 terminal of truths 因其在X 上幽默的發文和回應(類似微博上的「羅伯特」)而廣受關注,並獲得了a16z 創始人Marc Andreessen 的5 萬美元資助。受到其發佈內容的啟發,有人創建了GOAT 代幣,短短24 小時內漲幅超過10000%。 AI Agent 的話題隨即引起了Web3 社群的關注。之後,基於Solana 的首個去中心化AI 交易基金ai16z 問世,推出了AI Agent 開發框架Eliza,並引發了大小寫代幣之爭。然而,社群對AI Agent 的概念仍不清楚:AI Agent 的核心到底是什麼?與Telegram 交易機器人有何不同?
工作原理:感知、推理與自主決策
AI Agent 是一種基於大型語言模型(LLM)的智慧代理系統,能夠感知環境、進行推理決策,並透過呼叫工具或執行操作來完成複雜任務。工作流程:感知模組(取得輸入)→ LLM(理解、推理與規劃)→ 工具呼叫(執行任務)→ 回饋與最佳化(驗證與調整)。
具體來說,AI Agent 首先透過感知模組從外界環境中獲取資料(如文字、音訊、圖像等),並將其轉化為可以處理的結構化資訊。 LLM 作為核心元件,提供強大的自然語言理解與生成能力,作為系統的「大腦」。基於輸入的資料和已有的知識,LLM 進行邏輯推理,產生可能的解決方案或製定行動計劃。隨後,AI Agent 透過呼叫外部工具、插件或API 完成具體的任務,並根據回饋對結果進行驗證與調整,形成閉環優化。
在Web3 的應用場景中,AI Agent 與Telegram 交易機器人或自動化腳本有何不同?以套利為例,用戶希望在利潤大於1% 的條件下進行套利交易。在支援套利的Telegram 交易機器人中,使用者設定好利潤大於1% 的交易策略,Bot 開始執行。然而,當市場波動頻繁,套利機會不斷變化時,這些Bot 缺乏風險評估能力,只要滿足利潤大於1% 的條件就執行套利。相比之下,AI Agent 能自動調整策略。例如,當某筆交易的利潤超過1%,但透過數據分析評估其風險過高,市場可能突然變化導致虧損,它會決定不執行這筆套利。
因此,AI Agent 具備自我適應性,其核心優勢在於能夠自我學習與自主決策,透過與環境(如市場、使用者行為等)的互動,根據回饋訊號調整行為策略,不斷提升任務執行效果。它還能基於外部數據即時做出決策,並透過強化學習不斷優化決策策略。
這麼一說是不是有點像是意圖框架下的求解器(slover)? AI Agent 本身也是基於意圖的產物,與意圖框架下的求解器最大的區別就是,求解器依靠精確演算法,具有數學上的嚴謹性,而AI Agent 決策依賴於資料訓練,往往需要在訓練過程中通過不斷試錯來接近最優解。
AI Agent 主流框架
AI Agent 框架是是用於建立和管理智慧代理的基礎架構。目前在Web3 裡,比較流行的框架包括 ai16z 的Eliza、zerebro 的ZerePy 和 Virtuals 的GAME。
Eliza 是一個多功能的AI Agent 框架,使用TypeScript 構建,支援在多個平台(如Discord、Twitter、Telegram 等)上運行,並透過複雜的記憶管理,能夠記住先前的對話和上下文,保持穩定一致的個性特徵和知識回答。 Eliza 採用RAG(Retrieval Augmented Generation)系統,能夠存取外部資料庫或資源,從而產生更精確的答案。此外,Eliza 整合了TEE 插件,允許在TEE 中部署,從而確保資料的安全性和隱私性。
GAME 是賦能和驅動AI Agent 進行自主決策和行動的框架。開發者可以根據自己的需求自訂代理的行為,擴展其功能,並提供客製化的操作(如社群媒體發布、回覆等)。框架中的不同功能,如代理的環境位置和任務等,被劃分為多個模組,方便開發者進行配置和管理。 GAME 架構將AI Agent 的決策過程分為兩個層級:高階規劃(HLP) 和低階規劃(LLP),分別負責不同層次的任務和決策。高階規劃負責設定代理的總體目標和任務規劃,根據目標、個性、背景資訊及環境狀態制定決策,以確定任務的優先順序。低層規劃則著重於執行層面,將高階規劃的決策轉化為具體操作步驟,選擇適當的功能和操作方法。
ZerePy 是一個開源的Python 框架,用於在X 上部署AI Agent。該框架整合了OpenAI 和Anthropic 提供的LLM,使開發者能夠建立和管理社交媒體代理,自動化執行如發布推文、回覆推文、按讚等操作。每個任務可以根據其重要性設定不同的權重。 ZerePy 提供了簡潔的命令列介面(CLI),以便於開發者快速啟動和管理代理程式。同時,框架也提供了Replit (一個線上程式碼編輯和執行平台)模板,開發者可以透過它快速開始使用ZerePy,而無需複雜的本地環境配置。
為什麼AI Agent 會面臨FUD?
AI Agent 看似智能,能夠降低入門門檻並提升用戶體驗,為什麼社群仍存FUD?原因在於,AI Agent 本質上仍只是一個工具,目前尚無法完成整個工作流程,只能在某些節點上提升效率、節省時間。而目前的發展階段,AI Agent 的角色多集中在幫助用戶一鍵發行MeMe 及經營社群媒體帳號。社區戲稱「assests belong Dev,liabilities belong AI」。
不過就在本週 aiPool 作為代幣預售的AI Agent 發布,利用TEE 技術實現了去信任化。該AI Agent 的錢包私鑰在TEE 環境中動態生成,確保安全性。用戶可以向AI Agent 控制的錢包發送資金(例如SOL),AI Agent 隨後根據設定規則創建代幣,並在DEX 上啟動流動性池,同時向符合條件的投資者分發代幣。整個過程無需依賴任何第三方中介,完全由AI Agent 在TEE 環境下自主完成,避免了DeFi 中常見的rug pull 風險。可見,AI Agent 正在逐步發展。我認為,AI Agent 能夠幫助用戶降低門檻、提升體驗,即使只是簡化部分資產發行過程,也是有意義的。但從宏觀的Web3 視角來看,AI Agent 作為鏈下的產物,當前階段只是充當輔助智能合約的工具角色,因此無需對其能力過度吹噓。由於今年下半年除了MeMe 之外缺乏顯著的財富效應敘事,AI Agent 的hype 圍繞MeMe 而展開由此火了也是正常。單靠MeMe 並無法維持長期的價值,所以如果AI Agent 能在交易流程中帶來更多創新玩法,提供切實的落地價值,它或許會發展成一種普遍的infra 工具。