作者:Azi.eth.sol | zo.me 來源:X,@MagicofAzi 翻譯:善歐巴,金色財經
人工智慧(AI)和區塊鏈技術是重新塑造我們世界的兩股變革力量。 AI透過機器學習和神經網路增強人類的認知能力,而區塊鏈技術則引入了可驗證的數位稀缺性,並使得無需信任的協調成為可能。當這些技術融合時,它們為網路的新一代奠定了基礎——一個自治代理與去中心化系統互動的網路。這個「代理化網路」引入了一個新的數位公民類別:可以獨立導航、談判和交易的AI代理。這個轉變重新分配了數位領域的權力,使個人能夠重新獲得對自己資料的主權,同時促進了一個人類和人工智慧以前所未有的方式協作的生態系統。
網路的演變
為了理解我們正在走向哪裡,讓我們先回顧網路的演進過程,其中每個階段都有不同的能力和架構範式:
前兩代網路專注於訊息傳播,而後兩代則使訊息增強成為可能。 Web 3.0透過代幣引入了資料所有權,而現在Web 4.0透過大型語言模型(LLMs)注入了智慧。
從大型語言模型到代理:一種自然的演變
LLMs代表了機器智慧的量子飛躍,作為動態的、模式匹配的系統,透過機率計算將海量的知識轉化為上下文理解。然而,當LLMs作為代理進行構建時,它們的真正潛力才會顯現——從純粹的資訊處理器進化為目標導向的實體,能夠感知、推理和行動。這種轉變創造了一種新興的智能,能夠透過語言和行動進行持續且有意義的協作。
「代理」一詞引入了一種新的範式,改變了人類與AI的互動方式,超越了傳統聊天機器人所帶來的限制和負面聯想。這種轉變不僅僅是語意上的變化,而是對AI系統如何在維持與人類的有意義合作的同時,能夠自主操作的根本重新定義。代理化的工作流程最終使得圍繞特定使用者意圖的市場得以形成。
最終,代理化網路不僅僅是智慧的新層次——它根本性地改變了我們與數位系統的互動方式。過去的網路版本依賴靜態的介面和預設的使用者路徑,而代理化網路則引入了一種動態的運行時基礎設施,其中計算和介面根據使用者的上下文和意圖即時進行調整。
傳統網站與代理化網絡
傳統網站是當今互聯網的基本單位,提供固定的介面,使用者透過預設的路徑讀取、寫作和與資訊互動。這個模型雖然功能齊全,但將使用者局限於為一般用途設計的介面,而非個人需求。代理化網路突破了這些局限,採用了情境感知計算、適應性介面產生、透過RAG和其他即時資訊檢索創新解鎖的預測行動流程。
可以參考TikTok如何透過創造高度個人化的推播內容,在即時適應用戶偏好的基礎上徹底革新了內容消費的方式。代理化網路將此概念擴展到整個介面生成的層面。不再是透過固定的網頁佈局進行導航,使用者與動態生成的介面進行互動,這些介面能夠預測並促進使用者的下一步。這個從靜態網站到動態、代理驅動的介面的轉變,代表了我們與數位系統互動方式的根本進化——從基於導航的互動模式轉變為基於意圖的互動模式。
代理的結構
代理化架構對於研究人員和開發者來說一直是一個巨大的探索領域。為了增強推理和解決問題的能力,新的方法不斷被發展出來。鍊式思維(Chain-of-Thought, CoT)、樹狀思維(Tree-of-Thought, ToT)和圖狀思維(Graph-of-Thought, GoT)等技術是提高大型語言模型(LLMs)處理複雜任務能力的創新範例,透過模擬更細緻、類人化的認知過程來實現。
鍊式思維(CoT) 促使大型語言模型將複雜任務分解成更小、更容易管理的步驟。這個方法對於需要邏輯推理的問題尤其有效,例如編寫簡短的Python腳本或解決數學方程式。
樹狀思維(ToT) 在CoT的基礎上進一步發展,採用了樹狀結構,允許探索多個獨立的思維路徑。這項改進使得LLMs能夠處理更複雜的任務。在ToT中,每個「思維」(LLM的文本輸出)僅與其前後的「思維」連接,構成一個局部鏈(樹枝)。儘管這個結構比CoT提供了更多靈活性,但它仍然限制了跨思想交流的潛力。
圖狀思維(GoT) 進一步拓展了這個概念,結合了經典的資料結構與LLMs。這種方法透過允許任何一個「思維」與圖中的其他思維連接,從而拓寬了ToT的範圍。這種思想之間的相互連結,更接近人類的認知過程。
GoT的圖狀結構通常比CoT或ToT更準確地反映人類的思考模式。雖然有些情境下我們的思維模式可能呈現鍊式或樹狀結構(例如在製定應急計劃或標準操作程序時),這些只是例外,而非常態。 GoT模型更符合人類思維的特點,人類思維常常跨越多個思維而不是嚴格遵循順序。雖然某些情境(如製定應急計劃或標準程序)可能依舊呈鍊式或樹狀,但我們的思維通常會形成複雜、互聯的思維網絡,這與GoT的圖狀結構更為契合。
GoT中的圖狀方法使得對思想的探索更具動態性和靈活性,有可能帶來更具創造性和全面性的解決問題能力。
這些基於遞歸圖的操作只是代理化工作流程的一個步驟。顯而易見的下一個演化是多個具有不同專業化的代理人相互協調,共同朝著特定目標前進。代理的魅力在於其組合。
代理使得透過多代理協調,模組化和並行化LLMs成為可能。
多代理系統
多代理系統的概念並不是一個新鮮的想法。它的根源可以追溯到馬文·明斯基(Marvin Minsky)的《心靈社會》一書,他提出多個模組化的心靈共同協作能夠超越單一、龐大的心靈。 ChatGPT和Claude是單一代理,Mistral普及了專家混合(Mixture of Experts)。我們認為,進一步擴展這個想法,代理網路架構將成為這款智慧拓撲的終極形態。
從仿生學的角度來看,與AI模型中數十億個相同的神經元以統一、可預測的方式連接不同,人的大腦(本質上是一個有意識的機器)在器官和細胞層面是極其異質化的。神經元透過複雜的訊號進行交流,涉及神經傳導物質梯度、細胞內級聯反應以及各種調節系統,使其功能比簡單的二元狀態要複雜得多。
這表明,在生物學中,智慧不僅僅來自組件數量或訓練資料集的大小。智能源自於不同專業化單元之間的複雜相互作用-一種本質上是模擬過程的方式。
因此,開發數百萬個小型模型而非少數幾個大型模型,並使這些模型之間能夠協調運作,更有可能推動認知架構的創新,類似於多代理系統的建構。
多代理系統設計相比單一代理系統具有若干優勢:它更加易於維護、理解和擴展。即使在只需要單一代理介面的情況下,將其實現為多代理框架也可以使系統更加模組化,從而簡化開發者根據需要添加或移除組件的過程。重要的是要認識到,即使是單一代理系統,多代理架構仍然可以是一種非常有效的建構方式。
多代理系統的優勢
雖然大型語言模型(LLMs)展示了驚人的能力——例如生成類人文本、解決複雜問題和處理各種任務——但單一LLM代理在現實應用中面臨的限制可能會影響其有效性。以下是與代理系統相關的五個主要挑戰,以及多代理協作如何克服這些挑戰,釋放LLMs的全部潛力。
-
透過交叉驗證克服幻覺
單一LLM代理經常會產生幻覺,產生不正確或荒謬的訊息。這種情況儘管模型經過大量訓練,輸出仍然可能看似合理但缺乏事實準確性。多代理系統允許代理之間交叉驗證訊息,從而降低錯誤的風險。透過各自的專業化,代理商能夠確保提供更可靠、更準確的回應。 -
透過分散式處理擴展上下文視窗
LLMs的上下文視窗有限,這使得處理較長的文件或對話變得困難。在多代理框架中,代理可以分擔處理負擔,每個代理處理一部分上下文。透過代理間的溝通,它們能夠保持整個文本的一致性,有效地擴展上下文視窗。 -
透過並行處理提高效率
單一LLM通常一次處理一個任務,這會導致反應時間較慢。多代理系統支援並行處理,使多個代理可以同時處理不同的任務。這提高了效率,縮短了回應時間,使得企業能夠在不延遲的情況下處理多個查詢。 -
促進複雜問題解決的協作
單一LLM在解決需要多樣化專業知識的複雜問題時常常力不從心。多代理系統促進了代理間的協作,每個代理貢獻其獨特的技能和觀點。透過合作,代理商能夠更有效地解決複雜挑戰,提供更全面和創新的解決方案。 -
透過資源優化提高可訪問性
高階LLM需要大量的運算資源,這使得其成本較高,難以普及。多代理框架透過將任務分配給不同的代理程式來優化資源使用,從而降低整體計算成本。這使得AI技術能夠更廣泛地被更多組織所採用。
儘管多代理系統在分散式問題解決和資源優化方面展現出令人信服的優勢,但其真正的潛力是在考慮其在網路邊緣的實現時展現出來的。隨著AI的不斷發展,多代理架構與邊緣運算的融合形成了強大的協同作用——不僅實現了協同智能,還能夠在無數設備之間進行高效的本地處理。這種分散式的AI部署方法自然延伸了多代理系統的優勢,將專門化的合作智慧帶到最需要的地方:最終用戶。
邊緣運算中的智能
AI在數位領域的普及正在推動運算架構的根本重構。隨著智慧成為我們日常數位互動的一部分,我們正在見證計算的自然分叉:專業化的資料中心處理複雜推理和特定領域任務,而邊緣設備則在本地處理個性化、上下文敏感的查詢。這種向邊緣推理的轉變不僅僅是架構偏好——它是由多個關鍵因素驅動的必要性。
首先,AI驅動的互動量龐大,會使集中式推理提供者不堪重負,產生不可持續的頻寬需求和延遲問題。
其次,邊緣處理能夠實現即時回應,這是自動駕駛汽車、擴增實境和物聯網設備等應用至關重要的特性。
第三,邊緣推理透過將敏感資料保存在個人裝置上來保護使用者隱私。
第四,邊緣運算透過最小化資料在網路中的流動,顯著減少能源消耗和碳足跡。
最後,邊緣推理支援離線功能和彈性,確保即使網路連接受限,AI功能仍然存在。
這種分散式智慧範式不僅僅是對當前系統的最佳化,它還根本性地重新構想了我們在日益互聯的世界中如何部署和與AI互動。
此外,我們也見證了LLM的運算需求的根本轉變。過去十年,訓練大型語言模型的巨大計算需求主導了AI的發展,而如今我們進入了一個推理時計算成為中心的時代。這項轉變在代理式AI系統的出現中尤其明顯,例如OpenAI的Q*突破,展示了動態推理需要大量即時運算資源。
與訓練時計算不同,訓練時計算是模型開發的單次投資,而推理時計算則代表為自主代理提供持續的計算對話,支持其推理、規劃和適應新情況。這種從靜態模型訓練到動態代理推理的轉變,要求我們對運算基礎設施進行根本性的重新思考——在這種新架構下,邊緣運算不僅是有利的,而是至關重要的。
隨著這項轉型的展開,我們正在見證邊緣推理市場的興起,成千上萬的互聯設備——從智慧型手機到智慧家庭系統——構成了動態運算網格。這些設備可以無縫地交換推理能力,創造一個有機的市場,在這個市場中,計算資源流向最需要的地方。空閒設備的剩餘運算能力變成了有價值的資源,可以即時交易,從而實現比傳統集中式系統更有效率、更具彈性的基礎設施。
這種推理計算的去中心化不僅優化了資源的利用,還在數位生態系統中創造了新的經濟機會,每個連接的設備都可以成為AI能力的潛在微型提供者。因此,AI的未來將不僅由單一模型的能力來定義,而是由互聯邊緣設備的集體智慧構成,形成一個全球性的、去中心化的推理市場,類似於一個基於供需的可驗證推理現貨市場。
以代理為中心的互動
如今,LLM讓我們可以透過對話存取大量訊息,而不是傳統的瀏覽方式。隨著網路轉變為一個AI代理平台而非僅供人類使用者使用的空間,這種對話式的方法很快就會變得更加個人化和在地化。
從使用者的角度來看,焦點將從選擇「最佳模型」轉向獲得最個人化的答案。更好的答案的關鍵在於結合使用者自己的數據與通用的網路知識。最初,較大的上下文視窗和檢索增強生成(RAG)將有助於整合個人數據,但最終,個人資料將在重要性上超越通用網路數據。
這將導致一個未來,我們每個人都有個人AI模型與更廣泛的網路專家模式互動。最初,個人化將與遠端模型同時進行,但由於隱私和響應速度的擔憂,更多的互動將轉向本地設備。這將創造一個新的邊界——不是在人與機器之間,而是在我們的個人模型與網路專家模型之間。
傳統的網路模式將變得過時,不再是存取原始資料。而是您的本地模型將與遠端專家模型進行通信,收集信息,並以最個性化、高頻寬的方式呈現給您。這些個人模型將變得愈加不可或缺,因為它們將更多地了解您的偏好和習慣。
互聯網將轉變為一個互聯模型的生態系統:本地的、高上下文的個人模型和遠端的、高知識的專家模型。這將涉及新技術,如聯邦學習(Federated Learning),以更新這些模型之間的資訊。隨著機器經濟的演進,我們將需要重新構想支撐這一過程的計算基礎,尤其是在計算、可擴展性和支付方面。這將導致一個以代理為中心、主權明確、高度可組合、自我學習並不斷發展的資訊空間的重組。
代理協定的架構
在代理式網路(Agentic Web)中,人類與代理人的互動發展為代理間複雜的通訊網路。這項架構為網際網路的結構提供了根本性的重新構想,在這個新結構中,主權代理成為數位互動的主要介面。以下是實現代理協議所需的核心原語:
-
主權身份
-
數位身分從傳統的IP位址過渡為由代理式行為者擁有的加密公鑰對。
-
基於區塊鏈的命名空間系統取代傳統的DNS,消除中央控制點。
-
聲譽系統追蹤代理的可靠性和能力指標。
-
零知識證明(Zero-Knowledge Proofs)實現隱私保護的身份驗證。
-
身分的可組合性使代理能夠管理多個上下文和角色。
-
自主代理
-
自然語言理解和意圖解析
-
多步驟規劃與任務分解
-
資源管理與最佳化
-
從互動和回饋中學習
-
在定義的參數內自主決策
-
代理專業化及特定能力市場
-
內建安全機制和對齊協議
-
能夠自我指引的實體,具備:
-
數據基礎設施
-
即時資料攝取與處理能力
-
分散式資料驗證和驗證機制
-
混合系統組合:zkTLS、傳統訓練資料集、即時網頁抓取和資料合成
-
協作學習網絡
-
RLHF(基於人類回饋的強化學習)網絡
-
分散式回饋收集
-
品質加權共識機制
-
動態模型調整協議
-
計算層
-
點對點計算市場
-
計算證明系統
-
動態資源分配
-
邊緣運算集成
-
計算完整性
-
結果可重現性
-
資源效率
-
可驗證的推理協議,確保:
-
去中心化的運算基礎設施,具有:
-
模型生態系統
-
任務特定的小型語言模型(SLMs)
-
通用大型語言模型(LLMs)
-
專門化的多模態模型
-
大型行動模式(LAMs)
-
層次化模型架構:
-
模型組合與協調
-
持續學習和適應能力
-
標準化的模型介面和協議
-
協調框架
-
並發任務處理
-
資源隔離
-
狀態管理
-
衝突解決
-
加密協定確保安全的代理互動
-
數位產權管理系統
-
經濟激勵結構
-
治理機制:爭議解決、資源分配、協議更新
-
並行執行環境支援:
-
代理市場
-
治理與分紅
-
代理在創世時擁有一定比例的代幣
-
聚合的推理市場透過流動性支付
-
控制鏈下帳戶的鏈上密鑰
-
鏈上原語用於身分(例如:Gnosis, Squad multisigs)
-
代理間的經濟學與交易
-
代理擁有流動性
-
代理成為收益-bearing資產
-
代理DAO
為智慧創建超結構
現代分散式系統設計為實現代理協議提供了獨特的靈感和原語,特別是事件驅動架構和更直接的計算「演員模型(Actor Model)」。
演員模型為實現代理系統提供了一個優雅的理論基礎。這個計算模型將“演員”視為計算的通用原語,每個演員可以:
-
處理訊息
-
做出本地決策
-
創造更多的演員
-
向其他演員發送訊息
-
決定如何回應接收到的下一則訊息
演員模型為代理系統帶來的關鍵優勢包括:
-
隔離性:每個演員獨立操作,保持自己的狀態和控制流程。
-
非同步通訊:演員之間的訊息傳遞是非阻塞的,允許高效的並行處理。
-
位置透明性:演員可以不受實體位置的限制,彼此之間進行溝通。
-
容錯性:透過演員的隔離和監督層次結構來實現系統的韌性。
-
可擴展性:自然支援分散式系統和平行計算。
我們提出了Neuron,一個透過多層分散式架構實現此理論代理協議的實際方案。該架構結合了區塊鏈命名空間、聯邦網路、CRDTs(衝突自由資料類型)和DHTs(分散式雜湊表),每一層在協定棧中承擔不同的功能。我們從早期的點對點作業系統設計先驅-Urbit和Holochain中汲取靈感。
在Neuron中,區塊鏈層提供了可驗證的命名空間和身份驗證,允許確定性地尋址和發現代理,同時保持能力和聲譽的加密證明。在此之上,DHT層促進了高效的代理和節點發現,以及內容路由,具有O(log n)的查找時間,減少了鏈上操作的數量,同時實現了本地感知的對等節點發現。透過CRDTs,聯邦節點之間的狀態同步得以處理,使代理人和節點能夠維持一致的共享狀態,而無需對每個互動進行全局共識。
這種架構自然地映射到一個聯邦網絡,其中自主代理作為主權節點運行在具有本地邊緣推理功能的設備上,實施演員模型的模式。聯邦域可以根據代理的能力進行組織,DHT提供了域內和域間的高效路由和發現。每個代理人作為一個獨立的演員運作,擁有自己的狀態,而CRDT層確保整個聯邦的最終一致性。這種多層架構實現了若干關鍵能力:
-
去中心化協調
-
使用區塊鏈實現可驗證的身份和全球主權命名空間
-
DHT用於高效率的對等節點和內容路由,O(log n)查找
-
CRDTs用於並發狀態同步和多代理協調
-
可擴展操作
-
基於區域的聯邦拓撲結構
-
分層儲存策略(熱儲存/溫儲存/冷儲存)
-
本地感知的請求路由
-
基於能力的負載分配
-
系統韌性
-
無單點故障
-
在分區期間持續運行
-
自動狀態調和
-
透過監督層次結構實現容錯
這種實施方法為建構複雜的代理系統提供了堅實的基礎,同時保持了主權性、可擴展性和韌性等關鍵特性,確保代理之間的有效互動。
總結思考
代理式網路標誌著人機互動的關鍵演進,超越了以往時代的線性發展,建立了一種全新的數位存在範式。與過去單純改變我們如何消費或擁有資訊的迭代不同,代理式網路將網路從以人為中心的平台轉變為一個智慧基礎層,在這個層面上,自主代理成為主要的行動者。這一轉變由邊緣運算、大型語言模型和去中心化協議的融合驅動,創造了一個生態系統,其中個人AI模型與專業的專家系統無縫對接。
隨著我們邁向這個以代理為中心的未來,人類與機器智慧之間的邊界開始模糊,取而代之的是一種共生關係,在這種關係中,個性化的AI代理作為我們的數位延伸,理解我們的上下文,預測我們的需求,並自主地在廣闊的分散式智慧景觀中導航。因此,代理式網路不僅是技術的進步,更是對數位時代人類潛力的根本重新構想,在這種架構下,每一次互動都成為增強智慧的機會,每個設備都成為全球協作AI系統網路中的一個節點。
就像人類在空間和時間的物理維度中導航一樣,自主代理在它們自己的基本維度中存在:區塊空間用於存在,推理時間用於思考。這種數位本體論與我們的物理現實相映成趣——人類跨越距離、體驗時間流,而代理則通過加密證明和計算週期進行“運動”,創造出一個平行的算法存在宇宙。
在去中心化的區塊空間中運行的潛在空間中的實體將是不可避免的。