深度解析多智能體系統:Web3與AI的未來相互成就之路


AIGC開啟了內容生成的智慧時代,而AI Agent則是將其能力產品化的體現。 AI Agent像人類一樣觀察環境、做決策並行動,被視為理想的智慧助理。 AI領域專家對其前景寄予厚望,認為它將成為人機互動的主流。 AI Agent透過自主理解、記憶和規劃,能夠在多個任務中表現出色,而Multi-Agent框架則可融合不同能力以解決複雜問題。結合Web3技術,AI Agent可望實現去中心化,提升運算資源的利用率,推動各產業的發展與創新。

如果說AIGC開啟了內容生成的智慧時代,那麼AI Agent則有機具備AIGC的能力真正產品化。

AI智能體就像一個大象的全能員工,被稱為人工智慧機器人的初級形態,能夠類似人類一般觀察周圍環境、做出決策,並自動採取行動。

比爾蓋茲曾直言,「掌控AI Agent,才是真正的成就。屆時,你將不再需要特權上網搜尋資訊。」AI領域的權威專家們也對AI Agent的前景寄予厚望。微軟CEO薩提亞‧納德拉曾預見,AI Agent將成為人機互動的主要方式,能夠理解使用者需求並主動提供服務。吳恩達教授亦預測,在未來的工作環境中,人類和AI Agent將更緊密的方式協作,形成高效率的工作模式,提高效率。

AI Agent不單是科技的產物,更是未來生活與工作方式的核心。

這不禁讓人回想起,當Web3和區塊鏈剛引起廣泛討論時,人們也普遍用「取代」來形容這個技術的潛力。回顧過去幾年,Web3來自最初的ERC-20、零知識證明,逐漸發展到了與其他領域融合的DeFi、DePIN、GameFi 等。

若將Web3與AI這個熱門數位科技結合,會不會產生1+1>2的效果呢?融資規模越來越龐大的Web3 AI項目,能否為產業帶來新的案例範式,創造新的真實需求?

AI Agent:人類最理想的智慧助手

AI特工的想像力到底在哪裡?網路上盛傳一個高分答案,「大語言模型只能編個貪吃Serpent,而AI特工可以編出一整個王者榮耀。」聽起來很誇張,但言過其實。

Agent,國內通常翻譯為「智體」。這個概念由「人工智慧之父」明斯基在1986年出版的《思維的社會》一書中提出,明斯基認為社會中的某些個體經過協商之後是可得的出問題的解,這些個體就是Agent。多年來,Agent 一直是人機互動的基石,從微軟的剪輯助手Clippy 到Google Docs 的自動建議,這些早期形態的Agent 催生了個性化互動的潛力,但在處理更複雜的任務方面能力仍然有限。直到大語言模型(LLM)的出現,Agent的真正潛力才得以被挖礦。

今年5月,AI領域權威學者吳恩達教授在美國紅杉AI活動上分享了關於AI Agent的演講,其中,他展示了其團隊所做的一系列實驗:

讓AI去寫一些程式碼並運行,對比不同LLM和工作流程的結果。結果如下:

GPT-3.5模型:準確率48%

GPT-4模型:準確率67%

GPT-3.5 + Agent:GPT-4模型的表現

GPT-4 + Agent:遠古GPT-4模型,非常出色

大多數人在使用ChatGPT這種LLM時,方式通常是:輸入一段提示詞,大模型會立即產生答案,不會自動辨識並修正錯誤刪除重寫。

相較之下,AI Agent的工作流程是這樣的:

首先,先讓LLM寫一篇文章大綱,如有需要,先在網路上搜尋內容進行研究分析,初步輸出稿件,然後閱讀草稿並思考如何優化,如此循環往復、多次迭代,最終輸出一篇邏輯嚴謹、錯誤率最低的高品質文章。

我們可以發現,AI Agent與LLM的差異在於,LLM與人類之間的互動是基於提示詞(prompt)進行的。而AI Agent具體設定一個目標,它就能夠針對目標獨立思考並做出行動。給定任務詳細拆解每一步的規劃步驟,依靠來自托盤的回饋和自主思考,自己給自己創建提示,來實現目標。

因此OpenAI 對AI Agent 的定義是:以LLM 為大腦驅動,具有自主理解、規劃、記憶和使用工具的能力,能夠自動化執行完成複雜任務的系統。

當AI從被使用的工具變成可以使用工具的主體,就成為了AI Agent。這也正是AI Agent可以成為人類最理想的智慧助理的原因。例如,AI Agent能夠基於使用者歷史線上交互,了解並記憶使用者的興趣、偏好、日常習慣,識別使用者的意願,主動提出建議,並協調多個應用程式去完成任務。

深度解析Multi-Agent:Web3與AI終將實現相互成就?

就類似於在蓋茲的構想中,未來我們不再需要為不同的任務切換到不同的應用中,只需用平時的語言告訴電腦和手機想做的事情,根據用戶願意共享的數據,AI代理將提供個性化的回應。

單人獨角獸公司正在成為現實

AI Agent也能夠協助企業打造以「人機和諧」為核心的自動化營運新模式。越來越多的業務活動將由AI來完成,而人則只需聚焦於企業願景、策略和關鍵路徑的決策。

正如OpenAI 先鋒訪談Sam Altman 曾在中提到過這樣一個引人注目的觀點,隨著AI 的發展,我們即將進入「單人獨角獸」時代,即由單人漫畫並達到10 億美元估值的公司。

聽起來是天方夜譚,但在AI代理的助力下,這個觀點正在成為現實。

袁做個假設,現在我們要一頁一家科技公司。按照傳統方法,顯然我需要雇用軟體工程師、產品經理、設計師、行銷人員、銷售和財務人員,各司其職但都由我來協調。

現在如果使用AI Agent呢,我可能甚至不需要雇用員工。

Devin — 自動化編程

替代軟體完成工程師,我可能會使用今年爆火的AI軟體工程師Devin,它能幫助我所有前端和枕頭的工作。

Devin 由Cognition Labs 開發,被稱為「世界上第一個AI 軟體工程師」。它能夠獨立完成整個軟體開發工作,獨立分析問題、做出決策、編寫程式碼並修復錯誤,大部分自主執行。減輕了開發人員的工作負擔。 Devin 在短短半年內就獲得了1.96 億美元的融資,估值迅速飆升至目前的億美元,投資者包括Founders Fund、Khosla Ventures 等創投公司。

雖然Devin 推出公開版本,但我們可以從另一個最近爆紅的Web2 的產品遊標一窺潛力。它幾乎可以為你完成所有工作,將一個簡單的想法在幾十內轉化為功能性代碼,你按下要發號施令,就可以「坐享其成」。有報道稱,一個八歲的孩子,在沒有任何程式設計經驗的情況下,竟然使用遊標完成程式碼工作並建造了一個網站。

Hebbia — 文件處理

替代產品經理或財務人員,我可能會選擇Hebbia,它可以幫助我完成所有文件的整理和分析。

與Glean 托盤企業內文檔搜尋不同,Hebbia Matrix 是一個企業級的AI 代理平台,借助多個AI 模型,幫助使用者快速提取、格式化、分析資料和文檔,從而推動企業生產力的提升。最深刻的是,Matrix 能夠一次處理數十百萬份文件。

Hebbia於今年7月完成了1.3億美元的B輪,a16z領投,Google Ventures、Peter Thiel等知名投資者參投。

Jasper AI — 內容生成

替代公司媒介營運和設計,我可能會選擇Jasper AI,它能幫我完成內容的生成。

Jasper AI 是一款AI Agent 寫作助手,旨在幫助創作者、行銷人員和企業簡化內容生成流程,並提高生產力和創作效率。 Jasper AI 能夠根據用戶要求的風格產生多種類型的內容,包括部落格文章、社群媒體貼文、廣告文案和產品等。並根據使用者的描述產生圖片,為文字內容提供輔助。

Jasper AI 已獲得1.25 億美元的融資,並在2022 年達到了15 億美元的估值。根據統計數據,Jasper AI 已幫助用戶產生超過5 億個單詞,成為使用最廣泛的AI 寫作工具之一。

MultiOn — 網頁自動化操作

替代助理,我可能會選擇MultiOn,幫我管理日常任務​​、安排行程、設定提醒,甚至是規劃出差的行程,自動預約飯店,自動安排叫車。

MultiOn 是一個自動化的網路任務AI 代理,能夠幫助在任何數位環境中自主執行任務,例如幫助用戶完成線上購物、預約等個人任務,提升個人效率,或幫助用戶簡化日常事務,提高工作效率。

困惑——搜尋、研究

替代研究員,我可能會選擇英偉達執行長每天都使用的困惑。

Perplexity 是一個AI 搜尋引擎,能夠理解用戶的提問,分割問題,然後搜尋和整合內容,產生報告,向用戶提供清晰的答案。

困惑適用於使用者群體群體,例如學生和研究人員可以簡化寫作時的資訊搜尋流程,提高效率;行銷人員可以獲得可靠的資料支援行銷策略。

以上內容想像一下,此時這些AI Agent的真正能力和水準尚可取代各行各業中的精英人才。 正如Logenic AI聯合創始人李博傑所言,目前LLM的能力還只是入門級水平,顯然達到了達不到專家級,現階段的AI代理最初是一個乾活比較快但不太可靠的員工。

然而,這些人工智慧代理憑藉各自的特長,正在支援現有用戶在虛擬場景中提高效率和便利性。

除了科技公司之外,各行各業都可以在AI Agent的浪潮中獲得收益。在教育領域,AI Agent可以根據學生的學習進展、興趣和能力提供個人化的學習資源和輔導;在金融領域,AI Agent可以根據學生的學習進展、興趣和能力提供個人化的學習資源和輔導; Agent可以幫助使用者管理個人財務,提供投資建議,甚至預測股票趨勢;在醫療領域,AI Agent可以幫助醫生進行疾病診斷和治療方案的發展;在電商領域,AI Agent還可以作為智慧客服,透過語言處理和機器學習技術會自動回答使用者諮詢,處理訂單問題和返回請求,從而提高客戶服務效率。

Multi-Agent:AI Agent的下一步

在上一節關於單人獨角獸公司的設想中,單一的AI Agent在處理複雜任務時面臨局限性,難以滿足實際需求。而運用多個AI Agent時,由於這些AI Agent基於LLM ,集合決策困難,能力有限,以致還需要人類擔當這些獨立AI Agent之間的調度員,協調這些服務於不同應用場景的AI Agent去工作。這就催生了「Multi Agent(多智體框架)」 」的崛起。

複雜問題往往需要融合多方面的知識和技能,而單一AI Agent的能力有限,難以勝任。透過將不同能力的AI Agent進行有機組合,Multi-Agent系統可以讓AI Agent發揮各自的長處,取長補短,從而更有效地解決複雜問題。

這非常類似於我們實際中的工作流程或組織結構:由一個領導者分配任務,擁有不同能力的人,負責不同的任務,每個進程執行的結果交給下一個進程,最終得到最後的任務結果。

在實現過程上,由較低層級的AI Agent執行各自的任務,而由較高層級的AI Agent分配任務,對它們完成的情況進行監督。

多智能體能夠模擬我們人類的決策過程,就像我們遇到問題時會找人商量一樣,多個AI智能體也可以中心化模擬決策的行為,為我們提供更好的資訊支援。例如由微軟開發AutoGen就滿足了這一點:

能夠創建不同角色的AI Agent。這些AI Agent具有基本的對話能力,能夠根據接收到的訊息,產生回應。

透過GroupChat來創造由多個AI Agent參與的群聊環境,在這個GroupChat中有一個管理員角色的AI Agent管理其他AI Agent的聊天記錄、發言者順序、發言結束等。

深度解析Multi-Agent:Web3與AI終將實現相互成就?

如果應用到單人獨角獸公司的設想裡,我們可以透過Multi-Agent架構創建幾個不同角色的AI Agent,例如專案經理、招募人員或主管。把我們的目標告訴他們,讓他們各自去想辦法,我們只要旁聽匯報,如果覺得有意見或他們做得不對,就讓他們改正,直到滿意為止。

相較於單一的AI Agent,Multi-Agent可以實現:

可擴展性:透過增加AI Agent的數量來處理更大規模的問題,每個AI Agent處理任務的一部分,使得系統能夠隨著需求的增長而擴展。

瘋狂性:天然支援瘋狂處理,多個AI Agent可以同時在問題的不同部分上工作,從而加速了問題的解決。

決策改進:每個透過聚合多個AI Agent的洞察力來增強決策制定,因為AI Agent都有自己的視角和專業知識。

隨著AI技術的不斷進步,可以想像多Agent框架將在更多產業中發揮更大的作用,並推動AI驅動的各類新解決方案的發展。

AI Agent之風,吹向Web3

邁出實驗室,AI Agent 和Multi-Agent 道阻且長。

暫時且具備Multi-Agent,甚至是最先進的單一AI Agent,其所需的算力資源和運算能力在物理層面上形成明顯的上限,無法實現無限擴展。一旦面臨最終的錯綜複雜、計算量密集的任務,AI Agent無疑將遭遇算力上限,性能大打折扣。

再者,AI Agent 和Multi-Agent 系統本質上是一種中心化的架構模式,這決定了它存在著極高的單一故障風險。更重要的是,OpenAI、微軟、Google等公司基於閉源大模型的壟斷商業模式,嚴重威脅獨立、單一的AI Agent新創公司的生存環境,使得AI Agent無法順利利用龐大的企業原生資料來使它們變得更加智慧、更高效率。 AI Agent之間需要民主化的協作環境,使得真正有價值的AI代理人能夠服務更封閉的需求人群,為社會創造更大的價值。

最後,雖然與LLM相比,AI Agent更貼近產業,但其發展基於LLM,而當前大模型的特點是技術含量高、資金投入多、商業模式尚且發展不成熟,AI Agent通常很難獲得融資以持續更新迭代。

Multi-Agent 的範式是Web3 助力AI 的絕佳角度,已經有引人注目的Web3 開發團隊正在這些方面投入研發提供解決方案。

深度解析Multi-Agent:Web3與AI終將實現相互成就?

AI Agent和Multi-Agent系統通常需要大量的運算資源來進行複雜的決策和處理任務。 Web3透過區塊鏈和去中心化技術,可以建立去中心化的算力市場,使得算力資源可以在全球範圍內使用範圍內更加公平和高效地分配和利用。 Akash、Nosana、Aethir、 IO.net 等Web3專案可以為AI Agent 決策和推理提供運算能力。

傳統的AI系統往往是中心化管理,導致AI Agent面臨單點故障和資料隱私問題,Web3的去中心化特性可以使得Multi-Agent系統更加去中心化和自治,每個AI Agent可以獨立地運作在在不同的地方節點上,自主執行使用者提出的需求,增強了穩健性和安全性。透過PoS、DPoS等機制建立針對質押者、委託者的激勵懲罰,可以促進單一AI Agent或多Agent系統的民主化。

在這方面,GaiaNet、Theoriq、PIN AI、HajimeAI都有非常前衛的嘗試。

Theoriq 是一個服務於「AI for Web3」的項目,希望透過Agentic Protocol 建立AI Agents 的呼叫和經濟系統,傳播Web3 的開發和眾多功能性場景,為Web3 dApp 提供可驗證的模型推理能力。

GaiaNet以節點為基礎的AI代理程式創建和部署環境,以保護專家、使用者的智慧財產權與資料隱私為出發點,抗衡中心化的OpenAI GPT Store。

HajimeAI則在兩者基礎上開發力AI Agent工作流程在實際需求中建立並針對介面本身的客製化、自動化,呼應PIN AI所提及的「AI智慧的個人化」。

同時,Modulus Labs 與ORA Protocol 分別在AI Agent 的zkML 和opML 的演算法方向上取得了進展。

最後,AI Agent和Multi-Agent系統的開發和迭代往往需要大量的資金支持,而Web3可以透過前流動性的特性幫助有潛力的AI Agent專案獲得寶貴的早期支持。

Spectral 和HajimeAI 都提出了支持發行鏈上AI 代理資產的產品架構:透過IAO(Initial Agent Offer)發行代幣,AI 代理可以直接從投資者獲得資金,同時成為DAO 治理的一員,為投資者提供其中HajimeAI的Benchmark DAO希望透過眾籌加代幣激勵的方式去,將中心化的AI Agent評分和AI Agent資產釋放有機結合起來,打造AI Agent依托Web3融資和冷鏈啟動的閉環,也是比較新穎的嘗試。

AI潘朵拉魔盒已然開啟,置身其中的每個人既興奮又迷茫,熱潮下是機遇還是暗礁,無人知曉。如今,各行各業都已不再是PPT融資時代,無論多麼前衛的技術,也只有落地才能實現價值。 AI Agent 的未來注定是一場漫長的馬拉松,而Web3 確實確保它不會在慶祝中黯然退場。

資訊來源:0x資訊編譯自網際網路。版權歸作者Meteorite Labs所有,未經許可,不得轉載

Total
0
Shares
Related Posts