AI + Blockchain=?

作者: Yihan Xu
來源:Foresight Ventures
原文標題:《Foresight Ventures: AI + Blockchain=?》

Overview

通過這篇文章你可以了解:

什麼是on-chain AI?

為什麼還沒有鏈上AI?

AI 上鍊的動力;

技術路徑;

我理解的on-chain AI 價值;

on-chain AI 的應用場景和項目分析。

一、AI + blockchain =?

開發者對基礎設施建設的瘋狂執著和各種rollup 解決方案的更新迭代確實讓原本落後的web3 計算能力實現了突破,這也為AI 上鍊提供了可能性,但你可能想說與其大費周章地實現鏈上AI,直接在鏈下運行模型似乎也能滿足大部分需求,而事實上現在幾乎所有的AI 模型都是以黑盒、中心化的模式在運行,並且同樣在各個領域創造了無法替代的價值。

1)先回到最基礎的問題,什麼是AI 上鍊?

主流的理解是通過區塊鏈讓AI 模型transparent + verifiable

再具體一點,AI 上鍊意味著人工智能模型的complete verification,也就是說一個模型需要向全網(用戶或驗證者)公開以下三點:

模型架構;

模型參數和權重:公開參數和權重有時候會對產品安全性產生負面影響,因此,針對特定場景,比如風控模型,可以對weight 做隱藏處理以確保安全性;

模型輸入:在web3 的場景里基本上是鏈上公開數據。

當滿足以上條件時,整個模型執行的過程是具備確定性的且不再是黑盒操作,任何人都可以在鏈上對模型的輸入和結果進行驗證,從而防止模型擁有者或者相關權限人對模型進行操縱。

2)AI + blockchain 的動力是什麼?

AI 與blockchain 結合的意義不在於替代中心化的Web2 人工智能的運作模式,而是:

在不犧牲去中心化和trustless 的基礎上,為web3 世界創造下一階段的價值。目前的區塊鏈就像是web2 的早期階段,還沒有承接更廣泛應用或者創造更大價值的能力。而只有在加入AI 之後,dapp 的想像力才能真正跳躍到下一階段,這些鏈上應用才有可能更接近web2 應用的水平,這種接近並不是從功能上做的更相似,而是通過發揮區塊鏈的價值,從用戶體驗和可能性上做出提升。

為web2 黑盒的AI 運行模式提供一種透明的、trustless 的解決方案。

想像一下web3 的應用場景:

將推薦算法加入到NFT 交易平台,基於用戶喜好推薦相應NFT,提高轉化;

在遊戲中加入AI 對手方,更透明、公平的遊戲體驗;

……

但是,這些應用都是通過AI 對已有的功能在效率或者用戶體驗上的進一步改善。

– 有價值嗎?有。

– 價值大嗎?取決於產品和場景。

AI 能創在的價值從來都不僅是99 到100 的優化,真正讓我興奮的,是從0 到1 的全新應用,一些只有通過transparent + verifiable 的鏈上模型才能實現的use case。不過這些“令人興奮的”use case 目前主要靠想像力,沒有成熟的應用,先來開幾個腦洞:

通過基於neural network 的決策模型做crypto trading:一種產品形態可能更像是copy trading 的升級版本,甚至是一種全新的交易玩法。用戶不再需要信任或調研其他experienced trader,而是對徹底公開透明的模型以及其performance 下注。本質上AI 根據對crypto 未來價格的預測更快更果斷地進行交易。然而沒有鏈上AI 自帶的“trustless autonomy”,這樣的下注對像或者標準根本是不存在的。用戶/投資者可以透明地看到模型決策的原因、過程甚至未來上漲/下跌的精確概率;

AI 模型作為裁判:一種產品可能是全新形態的預言機,通過AI 模型對數據來源的準確性進行預測。用戶不再需要信任validator,也不必擔心節點作惡,預言機提供方甚至不需要設計複雜的節點網絡和獎懲機制來實現去中心化。相應地,鏈上transparent + verifiable 的AI 已經足夠滿足驗證鏈下data source 置信度的任務。這種全新的產品形態在安全性、效率和成本上有機會形成碾壓,去中心化的對像也由人跳躍到“trustless autonomy”的AI 工具,無疑是更安全的。

基於大模型的組織管理/運作體系:DAO 的治理本質上應該是高效、去中心化、公平的,而現在的現狀卻背道而馳,鬆散且臃腫,缺乏透明和公平性,鏈上AI 的加入能提供非常契合的解決方案,將管理模式、效率提升到最高,將管理中系統性和人性的風險無限拉低。我們甚至可以去想像一種全新的web3 項目的發展和運作模式,整個框架及未來發展方向和提案幾乎不依賴開發團隊或者DAO 投票的方式來進行決策,相應的,基於大模型更龐大的數據獲取量和遠超人的計算能力去做決策。但這一切的前提也是模型上鍊,沒有AI 的“trustless autonomy”就不存在去中心化世界從人到工具的躍遷。

……

小結一下

基於鏈上AI 的新的產品形態基本可以總結為將去中心化和trustless 的主體從人變為AI 工具,這也符合傳統世界生產力的進化過程,最開始是在人這個主體上下功夫,不斷升級提升人效,到後面通過智能工具替代人,在安全性和效率上顛覆原有的產品設計。

其中最關鍵的、也是以上一切的前提,是通過區塊鏈實現AI 的transparent + verifiable。

3)Web3 的下一個階段

區塊鏈作為一個現象級的技術創新,不可能僅僅停留在原始階段。流量和經濟模型很重要,但用戶不會一直停留在追捧流量或花費大量資源做X to earn,web3 也不會因此onboard 下一波新用戶。但有一件事的確定性是很強的:web3 世界生產力和價值的革命一定來自AI 的加入。

我覺得大致分成下面三個階段

起始:零知識證明算法和硬件的更新迭代為鏈上AI 的湧現第一次提供了可能性;(我們在這)

發展:不管是AI 對已有應用的提升還是基於AI + blockchain 的全新產品,都在將整個行業向前推進;

終局:AI + blockchain 的最終走向是什麼?

上面的討論都是通過AI 與區塊鏈的結合bottom up 地發掘應用場景,換個思路top down 地看待AI + blockchain,AI 會不會重溯區塊鏈本身? AI + blockchain = 自適應的區塊鏈

一些公鏈會率先融合鏈上AI,從公鏈的層面轉變為一種自適應的,自身發展方向不再依賴項目基金會決策而是基於龐大數據進行決策、自動化水平遠超傳統區塊鏈的形態,從而從當前多鏈繁榮的格局中脫穎而出。

在verifiable + transparent 的AI 加持下,blockchain 的自調節體現在哪裡,可以參考modulus lab 提到的幾個例子:

鏈上的交易市場可以去中心化地自動調節,比如基於鏈上公開數據實時、不需要trust assumption 地調整穩定幣的interest rate;

多模態學習可以讓鏈上協議的交互通過生物特徵識別完成,提供安全的KYC,並實現身份管理的完全去信任;

允許鏈上應用最大化地捕獲鏈上數據帶來的價值,支持定制化內容推薦等服務。

從另一個角度看,zkrollup 不斷迭代優化,但是始終缺乏一個真正只能在zk 生態上跑的應用,ZKML 恰好符合這一點,並且想像空間也足夠大。 ZK-rollup 未來很可能作為AI 進入web3 的入口從而創造更大價值,兩者互相成就。

二、實現方式和可行性

1)Web3 能為AI 提供什麼?

基礎設施和ZK 無疑是web3 最瘋狂內捲的賽道,各種ZK 項目在電路優化和算法升級上下足了功夫,不管是對多層網絡的探索,或者是對模塊化區塊鏈以及data availability layer 的開發,還是進一步將rollup 做成定制化的服務,甚至硬件加速……這些嘗試都在將區塊鏈的可擴展性、成本、算力推向下一個階段。

AI + blockchain 聽上去不錯,但具體怎麼個加法?

一種做法是通過ZK proof system。比如針對machine learning 做一個定制化的電路,鏈下電路生成witness 的過程就是模型執行的過程,對模型預測的過程生成proof(其中包括模型參數和input),任何人都可以在鏈上驗證proof。

AI 模型還是在高效的集群上執行,甚至搞點硬件加速進一步提升計算速度,在最大化利用算力的同時確保沒有中心化的人或者機構可以從中篡改或乾涉模型,也就是確保:

模型預測結果的確定性= 可驗證的(input + 模型架構+ 參數)

根據以上做法,可以進一步推斷哪些infra 對AI 上鍊至關重要:

ZKP system、rollup:Rollups 擴張了我們對區塊鏈計算能力的想像空間,把一堆transactions 打包,甚至遞歸地生成proof of proof 進一步降低成本。對於現在龐大的模型來說,提供可能性的第一步就是proof system 和rollup;

硬件加速:ZK rollup 提供了verifiable 的基礎,但proof 的生成速度直接關係到模型的可用性和用戶體驗,等待幾個小時去生成一個模型的proof 顯然是不work 的,因此,通過FPGA 進行硬件加速顯然是一個很好的boost。

密碼學:密碼學是區塊鏈的基礎,而鏈上模型以及敏感數據同樣需要保證隱私性。

補充:

大模型的基礎是GPU,沒有高並行的支持,大模型的效率將會非常低,也就無法運行。因此,對於一個鏈上的zk 生態:

GPU 友好= AI 友好

拿Starknet 舉例,Cario 只能在CPU 上跑,因此只能部署一些小的決策樹模型,長期來看並不利好大模型的部署。

2)挑戰:更強大的proof system

ZK Proof 的生成速度和內存使用情況至關重要,一個關係到用戶體驗和可行性,一個關係到成本和天花板。

現在的zkp system 夠用嗎?

夠用,但不夠好…

Modulus lab 在文章“The Cost of Intelligence: Proving Machine Learning Inference with Zero-Knowledge”非常詳細的分析了模型和算力的具體情況。有空可以讀一讀這篇ZKML 屆的”零號文獻- paper0“:https://drive.google.com/file/d/1 tylpowpaqcOhKQtYolPlqvx6 R2 Gv4 IzE/view

以下是paper0 中提到的不同證明系統

基於以上zk 算法,modulus lab 分別從時間消耗和內存佔用兩個維度出發進行測試,並且在這兩個維度中分別控制了參數和層數兩個核心變量。以下是benchmark suites,這樣的設計也可以大致覆蓋從LeNet5 的60 k 參數量,0.5 MFLOPs,到ResNet-34 的22 M 參數量,3.77 GFLOPs。

時間消耗的測試結果:

內存佔用的測試結果:

基於以上數據,整體看目前的zk 算法以及具備支持對大模型生成proof 的可能性,但相應的成本依舊很高,需要甚至10 倍以上的優化。以Gloth16 為例,雖然受益於高並髮帶來的computation time 的優化,但是作為tradeoff 內存佔用顯著增加。 Plonky2 和zkCNN 在時間和空間上的表現同樣驗證了這一點。

那麼現在問題其實就從zkp system 是否可以支持鏈上AI 轉變為了支持AI+Blockchain 付出代價值不值?並且隨著模型參數的指數級上升,對proof system 的壓力也會迅速增加。確實,現在有trustless 的神經網絡嗎,沒有!就是因為成本算不過來。

因此,打造一個為AI 定制化的proof system 至關重要。同時,實現對AI 這種單次調用計算十分複雜的邏輯,gas 的消耗模型也需重新設計,一個高性能的zkvm 至關重要,但現在我們已經能看到很多高性能的嘗試,比如OlaVM, polygon Miden 等,這些基礎設施的不斷優化極大提升了onchain-AI 的可行性。

三、應用是否值得期待?

儘管鏈上AI 還在很早期階段,用上面的分層來看可能只處於起始到發展之間,但AI 這個方向從不缺乏優秀的團隊和創新的想法。

就像上面說的,從AI + Blockchain 發展階段看現在市場處於起始到發展的中間階段,產品嚐試方向還是以基於現有功能對用戶體驗優化為主。但最能體現價值的還是通過AI 在鏈上將trustless 的主體由人變為工具,在安全性和效率上顛覆原有的產品形態。

下面從一些現有的應用嘗試出發,分析一下AI + Blockchain 長期的產品發展方向

1)The Rockefeller Bot:世界上第一個on-chain AI

Rockefeller 是modulus lab 團隊推出的第一個鏈上AI 的產品,有很強的“紀念價值”。這個模型本質上是一個trading bot,具體來說,rockefeller 的訓練數據是大量鏈上公開的WEth-USDC 的price/exchange rate,其本身是一個三層前饋經網絡模型,預測目標是未來WEth 價格漲跌。

以下是當trading bot 決策要進行交易時的流程:

Rockefeller 在ZK-rollup 上對預測結果生成ZKP;

ZKP 在L1 上被驗證(資金由L1 的合約保管),並執行操作;

可以看出trading bot 的預測、資金操作完全是去中心化且trustless 的,就像上面提到的,從更高維度看rockefeller 更像是一種全新的Defi 玩法。相比於信任其他trader,這種模式下其實用戶賭的是transparent + verifiable + autonomous 的模型。用戶可以不需要信任中心化的機構確保模型決策過程的合法性。同時,AI 也能最大程度上的消除人性的影響,更果斷地進行交易。

你可能已經想給Rockefeller 注點資金玩一玩了,但這真的能賺錢嗎?

並不能,按照modulus 團隊的說法,與其說rockefeller 是一個應用,他更像是on-chain AI 的POC,由於成本、效率、證明系統等多方面的限制,rockefeller 的主要目的是作為一個demo 讓web3 世界看到on-chain AI 的可行性。 (Rockefeller 已經完成任務下線TT)

2)Leela:世界上第一個on-chain AI game

最近發布的Leela vs the world 同樣是出自modulus lab。遊戲機制很簡單,人類玩家組成陣營對戰AI。遊戲中玩家可以質押下注,最終誰會贏得對局,每次match 結束後loser’s pool 會根據質押代幣的數量相應地分配給winner。

說到on-chain AI,這次modulus lab 部署了一個更大的deep neural network (Parameter 數量> 3,700,000)。雖然在模型規模和產品內容上Leela 都超越了rockefeller,但歸根結底這還是一次大型的on-chain AI experiment。 Leela 的背後的機制和運行模式才是需要關注的,這能幫我們更好地理解鏈上AI 的運行模式和改善空間,以下是官方給出的邏輯圖:

Leela 的每一次move,也就是每次預測,都會生成ZKP,並且只有在經過合約驗證之後才會在遊戲內生效。也就是說,受益於trustless autonomous AI,用戶下注的資金和公平性完全受到密碼學的保護還不需要信任遊戲開發者。

Leela 採用的是Halo2 算法,主要原因是它的工具和設計的靈活性可以幫助設計更高效的證明體系,具體performance 情況可以參考上面的測試數據。但同時在Leela 的運行中modulus 團隊也發現了Halo2 的弊端,比如生成證明的速度較慢,對one-shot proving 不友好等。因此,也更加印證了之前基於測試數據得出的結論:如果需要將更大的模型帶入web3,我們需要開發更強大的proof system。

不過Leela 的價值在於給我們帶來了AI + Web3 game 更大的想像空間,王者榮耀玩家此刻應該無比希望王者匹配算法fully on-chain:) Gamefi 需要更優質的內容支撐和更公平的遊戲體系,而on-chain AI 恰好提供了這一點。打個比方,在遊戲中加入AI-driven 的遊戲場景或者NPC,不管是玩家的遊戲體驗還是經濟體系的玩法都提供了巨大的想像空間。

3)Worldcoin:AI + KYC

Worldcoin 是一個鏈上身份體系(Privacy-Preserving Proof-of-Personhood Protocol),通過生物識別建立身份體係並實現支付等衍生功能,解決的問題是對抗女巫攻擊,現在的註冊用戶超過了1.4 m。

用戶通過一個叫Orb 的硬件掃描虹膜,將個人信息添加到數據庫中,Worldcoin 通過Orb 硬件中的計算環境運行CNN 模型壓縮並證實用戶虹膜數據的有效性。聽上去很強,但如果需要做到身份驗證的真正去中心化,worldcoin 團隊正在探索通過ZKP 驗證模型的輸出。

挑戰

值得一提的是,worldcoin 的CNN 模型的size:參數= 1.8 million,層數= 50。基於上面展示的測試數據,現有的proof system 在時間上完全可以勝任,但內存消耗對於消費級的硬件來說是不可能完成的。

4)其他項目

Pragma:Pargma 是從starkware 生態上發展起來的ZK oracle。同時團隊也在探索如何通過鏈上AI 解決去中心化鏈下數據驗證的問題。用戶不再需要信任validator,而是通過足夠精準且可驗證的鏈上AI 完成驗證鏈下data source 的工作,比如對於實際資產或者身份的驗證可以直接讓AI 去讀取相印的物理信息作為輸入並做出決策。

Lyra finance:Lyra finance 是一個option AMM,提供衍生品交易市場。為了提高資本利用率,Lyra 團隊和modulus lab 正在合作開發基於可驗證AI 模型的AMM。基於可驗證的、公平的AI 模型,Lyra finance 有機會成為AI + Blockchain 的一次大規模落地實驗,為web3 用戶首次帶來公平的matchmaking,通過AI 對鏈上市場進行優化,提供更高的回報。

Giza:ZKML 平台,將模型直接部署在鏈上而不是進行鏈下驗證,Nice try,but…由於算力以及Cairo 不支持CUDA-based 的證明生成的問題,Giza 只能支持一些小模型的部署。這也是最致命的問題,從長期來看,能對web3 產生顛覆性影響的一定是大模型,而這種規模的模型必須有強大的硬件支持,比如GPU。

Zama-ai:模型的同態加密。同態加密是一種加密形式,簡單表示為:f [E (x)] = E [f (x)],其中f 是運算操作,E 代表同態加密算法,x 是變量,比如:E (a) + E (b) = E (a + b)。允許對密文進行特定形式的代數運算得到仍然是加密的結果,將其解密所得到的結果與對明文進行同樣的運算結果一樣。模型的隱私性一直是AI + Blockchain 方向的熱點和瓶頸,雖然zk 對隱私友好,但zk 不等於privacy。 zama 致力於確保模型執行的privacy-preserving。

ML-as-a-service:這目前還只是一個思考方向,沒有具體的落地應用,但目的是通過ZKP 解決中心化ML 服務提供者作惡以及用戶信任的問題。 Daniel Kang 在文章“Trustless Verification of Machine Learning”中有詳細的描述(參考文中的一張圖)

四、關於AI + Blockchain 的總結

整體來說,在web3 世界裡的AI 處於非常早期的階段,但是毋庸置疑的是onchain-AI 的成熟和普及一定會把web3 的價值帶到另一個高度。從技術上看,區塊鏈能給AI 提供獨特的基礎設施,AI 也是改變web3 生產關係的重要工具,兩者的結合可以碰撞出很多可能性,這也是值得興奮和打開想像力的地方。

從AI 上鍊的動力看,一方面,transparent + verifiable 的鏈上AI 將去中心化和trustless 的主體從人變為AI 工具,極大提升了效率、安全性,並且為創造全新的產品形態提供了可能性;另一方面,區塊鏈的基礎設施不斷迭代,web3 真正需要一個能讓這些基礎設施發揮最大價值的殺手級應用,ZKML 恰好符合這一點,比如ZK-rollup 未來很可能作為AI 進入web3 的入口。

從可行性上看,現在的基礎設施能一定程度上支持一定規模的模型,但還有很多不確定因素。通過ZKP 做可驗證模型目前看是AI 上鍊的必經之路,可能也是確定性最強的將AI 帶入的web3 應用的技術路徑。但是長遠來看現在的proof system 需要再進行指數級的提升才能足夠支持日漸龐大的模型。

從應用場景看,AI 幾乎可以完美地參與到任何一個web3 的方向,不管是game、Defi、DID、tooling……雖然目前已有的項目非常匱乏而且缺乏長期價值,還沒有從一種提升效率的工具轉變為改變生產關係的應用。但值得興奮的是有人邁出了第一步,我們可以看到AI + blockchain 的最早期的樣子和之後的可能性。

Total
0
Shares
Related Posts