解構AI 框架：從智慧代理人到去中心化的探索

作者：Zeke，YBB Capital Researcher

前言

在先前的文章中，我們已經多次探討了對於AI Meme 現況及AI Agent 未來發展的看法。然而，AI Agent 賽道的敘事發展之快、演變之劇，還是讓人有點應接不暇。自從「真理終點」開啟Agent Summer 以來的短短兩個月內，AI 與Crypto 結合的敘事幾乎每週都有新變化。近期，市場的注意力又開始聚焦於技術敘事主導的「框架類」項目中，這條細分賽道僅在過去幾週就已經跑出了多匹市值過億甚至是過十億的黑馬。而這類專案也衍生出了一種新的資產發行範式，即專案以Github 程式碼庫發幣，基於框架打造的Agent 亦能再次發幣。以框架為底，Agent 為上。形似資產發行平台，事實上卻是獨屬於AI 時代的基礎建設模式正在浮現。我們該如何審視這種新趨勢？本文將從框架簡介開始結合自身思考去解讀AI 框架對於Crypto 究竟意味著什麼？

一、何謂框架？

從定義上來說AI 框架是一種底層開發工具或平台，整合了一套預先建置的模組、函式庫和工具，簡化了建構複雜AI 模型的過程。這些框架通常也包含用於處理資料、訓練模型和進行預測的功能。簡而言之，你也可以把框架簡單理解為AI 時代下的作業系統，如同桌面作業系統中的Windows、Linux，或是行動裝置中的iOS 與Android。每種框架都有其自身的優點和缺點，開發者可以依據具體的需求自由選擇。

雖然「AI 框架」一詞在Crypto 領域中仍屬新興概念，但從其起源來看，自2010 年誕生的Theano 算起，AI 框架的發展歷程其實已接近14 年之久。在傳統AI 圈無論是學界還是產業界都已經有非常成熟的框架可供選擇，例如穀歌的TensorFlow、Meta 的Pytorch、百度的飛槳、字節的MagicAnimate，針對不同場景這些框架均有各自的優勢。

目前在Crypto 中湧現的框架項目，則是依據這波AI 熱潮開端下大量Agent 需求所打造的，而後又向Crypto 其它賽道衍生，最終形成了不同細分領域下的AI 框架。我們以當前圈內幾個主流框架為例，擴展一下這句話。

1.1 Eliza

首先以ai16z 的Eliza 為例，框架是一個多Agent 模擬框架，專門用於創建、部署和管理自主AI Agent。基於TypeScript 作為程式語言開發，其優點就是相容性更佳，更易於API 整合。

依據官方文件所示Eliza 主要針對的場景便是社交媒體，例如多平台的整合支持，該框架提供功能齊全的Discord 集成且支持語音頻道、X/Twitter 平台的自動化帳戶、Telegram 的集成以及直接的API訪問。在對於媒體內容的處理上支援PDF 文件的閱讀與分析、連結內容提取與摘要、音訊轉錄、視訊內容處理、影像分析與描述，對話摘要。

Eliza 目前支援的用例主要為四類：

AI 助理應用程式：客戶支援代理、社群管理員、個人助理；
社群媒體角色：自動內容創作者、互動機器人、品牌代表；
知識工作者：研究助理、內容分析師、文件處理器；
互動角色：角色扮演角色、教育輔導員，娛樂機器人。

Eliza 目前支援的模型：

開源模型本地推理：例如Llama3、Qwen1.5、BERT；
使用OpenAI 的API 基於雲推理；
預設配置為Nous Hermes Llama 3.1B；
與Claude 整合以實現複雜查詢。

1.2 GAME

GAME(Generative Autonomous Multimodal Entities Framework) 是Virtual 推出的自動產生與管理的多模態AI 框架，其針對場景主要是遊戲中的智慧NPC 設計，該框架還有一個特別之處在於低程式碼甚至是無程式碼基礎的使用者也可使用，根據其試用介面來看使用者只需修改參數便可參與Agent 設計。

在專案架構上，GAME 的核心設計是透過多個子系統協同工作的模組化設計，詳細架構如下圖。

Agent Prompting Interface：開發者與AI 框架互動的介面。透過這個接口，開發者可以初始化一個會話，並指定會話ID、代理ID、使用者ID 等參數；
Perception Subsystem：感知子系統負責接收輸入訊息，並將其合成後傳送給策略規劃引擎。它還處理對話處理模組的回應；
Strategic Planning Engine：戰略規劃引擎是整個框架的核心部分，分為高階規劃器（High Level Planner）和低階策略（Low Level Policy）。高階規劃器負責制定長期目標和計劃，而低階策略則將這些計劃轉化為具體的行動步驟；
World Context：世界上下文包含了環境資訊、世界狀態和遊戲狀態等數據，這些資訊用於幫助代理商理解當前所處的情境；
Dialogue Processing Module：對話處理模組負責處理訊息和回應，它可以產生對話或反應作為輸出；
On Chain Wallet Operator：鏈上錢包操作員可能涉及區塊鏈技術的應用場景，具體功能不明確；
Learning Module：學習模組從回饋中學習並更新代理人的知識庫；
Working Memory：工作記憶儲存了代理人最近的動作、結果以及當前計劃等短期資訊；
Long Term Memory Processor：長期記憶處理器負責提取關於代理及其工作記憶的重要信息，並根據重要性評分、近期性和相關性等因素進行排序；
Agent Repository：代理倉庫保存了代理人的目標、反射、經驗和個性等屬性；
Action Planner：動作規劃器根據低階策略產生具體的行動計畫；
Plan Executor：計畫執行器負責執行動作規劃器產生的行動計畫。

工作流程:開發者透過Agent 提示介面啟動Agent，感知子系統接收輸入並將其傳遞給策略規劃引擎。戰略規劃引擎利用記憶系統、世界脈絡和Agent 庫中的信息，制定並執行行動計畫。學習模組則持續監控Agent 的行動結果，並根據結果調整Agent 的行為。

應用場景：從整個技術架構來看，該框架主要聚焦於Agent 在虛擬環境中的決策、回饋、感知及個性，在用例上除了遊戲也適用於Metaverse，在Virtual 的下方列表中可以看到已經有大量項目採用了該框架進行建構。

1.3 Rig

Rig 是一款以Rust 語言編寫的開源工具，專為簡化大型語言模型（LLM）應用程式的開發而設計。它透過提供一個統一的操作介面，使開發者能夠輕鬆地與多個LLM 服務提供者（例如OpenAI 和Anthropic）以及多種向量資料庫（如MongoDB 和Neo4j）進行互動。

核心特點：

統一介面：無論是哪個LLM 提供者或哪種向量存儲，Rig 都能提供一致的存取方式，大大減少了整合工作的複雜性；
模組化架構：框架內部採用模組化設計，包含「提供者抽象層」、「向量儲存介面」和「智慧型代理系統」等關鍵部分，確保了系統的靈活性和可擴充性；
類型安全：利用Rust 的特性實現了型別安全的嵌入操作，保障了程式碼品質與執行時間的安全性；
高效性能：支援非同步程式模式，優化了並發處理能力；內建的日誌記錄和監控功能有助於維護和故障排查。

工作流程：當使用者要求進入Rig 系統後，會先經過「提供者抽象層」，這裡負責標準化不同提供者之間的差異，並確保錯誤處理的一致性。接下來，在核心層中，智慧代理可以呼叫各種工具或查詢向量儲存來取得所需的資訊。最後，透過檢索增強生成（RAG）等高階機制，系統能夠結合文件檢索和上下文理解，產生精確且有意義的回應，然後再傳回給使用者。

應用情境：Rig 不僅適用於建立需要快速準確回答的問題解答系統，還可以用於創建高效的文件搜尋工具、具備情境感知能力的聊天機器人或虛擬助手，甚至支援內容創作，根據現有的資料模式自動產生文字或其他形式的內容。

1.4 ZerePy

ZerePy 是一個基於Python 的開源框架，旨在簡化在X ( 前Twitter) 平台上部署和管理AI Agent 的過程。它脫胎於Zerebro 項目，繼承了其核心功能，但以更模組化、更易於擴展的方式進行設計。其目標是讓開發者能夠輕鬆創建個人化的AI Agent，並在X 上實現各種自動化任務和內容創作。

ZerePy 提供了一個命令列介面(CLI)，方便使用者管理和控制其部署的AI Agent“1”。其核心架構基於模組化設計，允許開發者靈活地整合不同的功能模組，例如：

LLM 整合: ZerePy 支援OpenAI 和Anthropic 的大型語言模型(LLM)，開發者可以選擇最適合其應用場景的模型。這使得Agent 能夠產生高品質的文字內容；
X 平台整合: 框架直接整合X 平台的API，讓Agent 進行發佈、回覆、按讚、轉送等操作；
模組化連接系統: 該系統允許開發者輕鬆添加對其他社交平台或服務的支持，擴展框架的功能；
內存系統( 未來規劃): 雖然目前版本可能尚未完全實現，但ZerePy 的設計目標包括集成內存系統，使Agent 能夠記住之前的交互和上下文信息，從而生成更連貫和個性化的內容。

雖然ZerePy 和a16z 的Eliza 專案都致力於建立和管理AI Agent，但兩者在架構和目標上略有不同。 Eliza 比較著重於多智能體模擬和更廣泛的AI 研究，而ZerePy 則專注於簡化在特定社交平台(X) 上部署AI Agent 的過程，更偏向於實際應用中的簡化。

二、BTC 生態的翻版

其實從發展路徑而言，AI Agent 與23 年底、24 年初的BTC 生態有著相當多異曲同工之處，BTC 生態的發展路徑可以簡單概括為：BRC20-Atomical/Rune 等多協議競爭-BTC L2- 以Babylon為核心的BTCFi。而AI Agent 在成熟的傳統AI 技術堆疊基礎上則發展的更迅猛一些，但其整體發展路徑確實與BTC 生態有許多相似之處，我將其簡單概括如下：GOAT/ACT-Social 類Agent/ 分析類AI Agent 框架競爭。從趨勢上來說圍繞著Agent 去中心化、安全性做文章的基礎建設專案大機率也將承接這波框架熱，成為下個階段的主旋律。

那麼這條賽道是否會和BTC 生態一樣走向同質化、泡沫化？我認為其實不然，首先AI Agent 的敘事不是為了重現智能合約鏈的歷史，其次現有的AI 框架項目技術上無論是真有實力還是停滯於PPT 階段或ctrl c+ctrl v，至少它們提供了一種新的基建發展思維。許多文章將AI 框架比喻為資產發行平台，Agent 比喻為資產，其實相較於Memecoin Launchpad 和銘文協議，我個人覺得AI 框架更像未來的公鏈，Agent 更像未來的Dapp。

在現今的Crypto 中我們擁有數千條公鏈，數以萬計的Dapp。在通用鏈之中我們有BTC、以太坊以及各種異構鏈，而應用鏈的形式則更多樣化，如遊戲鏈、儲存鏈、Dex 鏈。公鏈對應AI 框架其實兩者本來就非常形似，而Dapp 也可以很好的對應Agent。

在AI 時代下的Crypto，極有可能將朝著這種形態前進，未來的爭論也將從EVM 與異構鏈的爭論轉為框架之爭，現在的問題更多的是怎麼去中心化或者說鏈化？這點我想後續的AI 基礎建設專案會在這個基礎上展開，而另一點是在區塊鏈上做這件事有什麼意義？

三、上鍊的意義？

區塊鏈無論與什麼事物結合，終歸是要面對一個問題：有意義嗎？在去年的文章裡我批判過GameFi 的本末倒置，Infra 發展的過渡超前，在前幾期關於AI 的文章中我也表達了並不看好現階段下實用領域中AI x Crypto 的組合。畢竟，敘事的動力對於傳統項目而言已經越來越弱，去年少有的幾個幣價表現較好的傳統項目基本上也得具備匹配幣價或超越幣價的實力。 AI 對於Crypto 能有什麼用？我之前想到的是Agent 代操作實現意圖，Metaverse、Agent 作為員工等相對較俗卻有需求的想法。但這些需求都沒有完全上鍊的必要，從商業邏輯來講也無法閉環。上一期提到的Agent 瀏覽器實現意圖，反而能衍生出資料標記、推理算力等需求，但兩者的結合還是不夠緊密且算力部分綜合多方面而言依舊是中心化算力佔優。

重新思考DeFi 的成功之道，DeFi 之所以能從傳統金融里分到一杯羹，是因為具備更高的可及性、更好的效率和更低的成本、無需信任中心化的安全性。如果照這個思路思考，我覺得能支持Agent 鏈化的理由也許還有幾個。

Agent 的鏈化是否能達到更低的使用成本而達到更高的可近性與可選擇性？最終讓獨屬於Web2 大廠的AI「出租權」讓一般使用者也能參與；
安全性，依據Agent 最簡單的定義，一個能被稱為Agent 的AI 理應能與虛擬或現實世界產生交互，如果Agent 能介入現實或是我的虛擬錢包，那麼基於區塊鏈的安全方案也算一種剛需；
Agent 能不能實現一套專屬於區塊鏈的金融玩法？例如AMM 中的LP，讓一般人也能參與自動做市，例如Agent 需要算力、資料標記等，而使用者在看好的情況下以U 的形式投入協議。又或者基於不同應用場景下的Agent 能形成新的金融玩法；
DeFi 在目前不具備完美的互通性，結合區塊鏈的Agent 如果能實現透明、可追溯的推理也許能比上一篇文章說到的傳統互聯網巨頭提供的agent 瀏覽器更具吸引力。

四、創意？

框架類計畫在未來也將提供一次類似GPT Store 的創業機會。雖然目前透過框架發布一個Agent 對於普通用戶還是很複雜，但我認為簡化Agent 構建過程且提供一些複雜功能組合的框架，在未來還是會佔據上風，由此會形成一種比GPT Store 更有趣的Web3創意經濟。

目前的GPT Store 仍偏向傳統領域的實用性且大部分熱門App 都是由傳統Web2 公司創建，而在收入上也是由創作者獨佔。依據OpenAI 的官方解釋，該策略僅對美國地區部分傑出開發者提供資金支持，給予一定額度的補助。

Web3 從需求上來看還存在許多尚需填補的方面，而在經濟體系上也可使Web2 巨頭不公平的政策更公平化，除此之外，我們自然也可以引入社區經濟來使Agent 更加完善。 Agent 的創意經濟將是一般人也能參與的機會，而未來的AI Meme 也將遠比GOAT、Clanker 上發行的Agent 更為聰明、有趣。

解構AI 框架：從智慧代理人到去中心化的探索

前言