探討ZKML的深層意義:零知識證明和區塊鏈在人工智慧和機器學習領域的應用方式


感謝Brian Retford、SunYi、Jason Morton、Shumo、Feng Boyuan、Daniel、Aaron Greenblatt、Nick Matthew、Baz、Marcin 和Brent 對本文提供了寶貴的意見、回饋和審查。
作者:格蕾絲&希爾
本文討論了人工智慧和機器學習在當前時代如何突飛猛進,以及如何使用區塊鏈和零知識證明來防止人工智慧失控的情況。文章介紹了機器學習的運作原理,以及如何將ZK應用到機器學習信任框架中。作者也總結了Web3中可應用ZK+ML的範例,並分析了ZKML的當前吸引力和大規模應用的距離。文章最後指出,ZK和區塊鏈為AI/ML的運作提供了一個安全且值得信任的環境,並呼籲支持更多的建設者,共同創造美好的未來。

感謝Brian Retford、SunYi、Jason Morton、Shumo、Feng Boyuan、Daniel、Aaron Greenblatt、Nick Matthew、Baz、Marcin 和Brent 對本文提供了寶貴的意見、回饋和審查。

作者:格蕾絲&希爾

對於我們這些加密貨幣愛好者來說,人工智慧已經火了一把。有趣的是,沒有人願意看到我們人工智慧失控的情況。區塊鏈發明的最初目的是防止美元失控,所以可能會嘗試防止人工智慧的失控。另外,我們現在出現了一種稱為零知識證明的新技術,為了確保事情不會出錯。但是,想要駕馭人工智慧這個野獸,我們必須了解它的工作原理。

機器學習的簡單介紹

人工智慧已經經歷了幾個名字的變化,從“專家系統”到“神經網路”,然後是“圖形模型”,最後演變為“機器學習”。所有這些都是「人工智慧」的子集,人們給它起了一個不同的名字,我們對人工智慧的了解仍在不斷加深。讓我們稍微深入了解機器學習,揭開機器學習神秘的面紗。

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用?

註:如今,大多數機器學習模型都是神經網絡,因為它們在許多任務中具有優異的性能。我們主要將機器學習稱為神經網路機器學習。

機器學習是如何運作的?

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用? 首先,讓我們快速了解機器學習的內部運作:

輸入資料重建:輸入資料需要處理成可以作為模型輸入的格式。這通常涉及重建和特徵工程,以提取有用的信息將資料轉換成合適的形式,例如輸入矩陣或張量(高維矩陣) )。這是專家系統方法。隨著深度學習的出現,處理層自動處理。

設定初始模型參數:初始模型參數包含多個層、激活函數、初始權重、偏移、學習率等。有些參數可以在訓練過程中透過最佳化演算法進行調整以提高模型的精確度。

訓練資料:

輸入資料輸入到神經網路中,通常從一個或多個特徵提取和建模關係層開始,如補充層(CNN)、循環層(RNN)或自註意力層。這些層學會從輸入資料中提取相關特徵並建模這些特徵之間的關係。

然後這些層的輸出傳遞給一個或多個附加層,這些層對輸入資料執行不同的計算和轉換。這些層通常主要涉及可學習權重矩陣的矩陣乘法和非線性激活函數的應用,但也可能包括其他操作,如頂層神經網路中的結構和礦池化,或循環神經網路中的迭代。這些層的輸出作為模型中下層的輸入,或作為最終的預測輸出。

取得模型的輸出:神經網路計算的輸出通常是一個向量或矩陣,表示影像分類的機率、情緒分析分數或其他結果,取決於網路的應用。通常還有一個錯誤評估和參數更新模組,根據模型的目的自動更新參數。

神經網路計算的輸出通常是一個支援或矩陣,表示影像分類的機率、情緒分析分數或其他結果,取決於網路的應用。通常更新還有一個錯誤評估和參數模組,根據模型的目的自動更新參數。如果解釋上面看起來太晦澀,可以參考下面使用CNN模型來辨識蘋果圖片的例子。

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用?

將影像以像素值矩陣的形式載入到模型中。此矩陣可以表示具有尺寸(高度、寬度、通道)的3D張量。

設定CNN模型的初始參數。

輸入影像透過CNN中的隱藏層,每層應用多個函數從影像中提取越來越複雜的特徵。每層的輸出通過非線性激活函數,然後進行礦池化以減少特徵圖的維度。最後一層通常是一個全連接層,根據提取的特徵產生輸出預測。

CNN 的最終輸出是機率最高的類別。這是輸入影像的預測標籤。

機器學習的信任框架

我們可以將以上內容總結為一個機器學習信任框架,包括四個機器學習的基本層,整個機器學習過程需要這些層是可信的才能可靠:

輸入:原始資料收費,有時還需要保密。

缺陷:輸入資料可能會被竄改,否則會惡意輸入污染,並且正確地進行了損失。

隱私:如果需要,輸入的資料不會外洩。

輸出:需要精準生成與傳輸

缺陷:輸出正確生成。

隱私:如果需要,輸出不會洩漏。

模型類型/演算法:模型應正確計算

錯誤:模型執行正確。

隱私:如果需要,模型本身或計算不會洩漏。

不同的神經網路模型有不同的演算法和層,適用於不同的例子和輸入。

拓撲神經網路(CNN)通常涉及用於網格狀資料的任務,如影像,其中局部模式和特徵可以透過對小輸入區域應用拓撲操作來捕獲。

另一方面,循環神經網路(RNN)非常適合順序數據,例如時間序列或自然語言,其中狀態可以隱藏捕獲來自先前時間步的資訊並建模時間依賴關係。

自註意力層對於捕捉輸入機器中元素之間的關係有用,設定對於諸如翻譯或摘要之類的任務關係非常有效,這些任務中長程依賴關鍵。

還有其他類型的模型,包括多層栽培機(MLP)等。

模型參數:在某些情況下,參數應該是透明或民主生成,但在所有情況下都不易被竄改。缺陷:參數以正確的方式產生、維護和管理。隱私權:模型擁有者通常會進行機器學習模型參數保密,以保護開發此模型組織的智慧財產權和競爭優勢。這種現像只在變壓器模型變得瘋狂昂貴的之前非常普遍,但對產業來說仍然是一個主要問題。

機器學習的信任問題

隨著機器(ML)應用的爆炸性增長(複合年增長率超過20%)以及它們在日常生活中的高頻學習,例如最近備受歡迎的ChatGPT,機器學習的信任問題日益關鍵因此,找到並解決這些信任問題至關重要,以確保選舉地利用AI並防止其潛在補給。然而,到底是哪些問題呢?讓我們深入了解。

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用?

透明度或可證明性不足

信任問題長期困擾機器學習,主要有兩個:

隱私性質:如上所述,模型參數通常是公開的,而在某些情況下,模型輸入也需要保密,這自然會在模型所有者和模型使用者之間帶來信任問題。

演算法黑盒:機器學習模型有時被稱為“黑盒”,因為它們在計算過程中涉及許多難以理解或解釋的自動化步驟。這些步驟涉及複雜的演算法和大量的數據,有時會帶來不確定性隨機的輸出,使得演算法容易受到偏見甚至被修正的錯誤。

在更深入的前面,本文的一個更大的假設是模型已經“準備好使用”,這意味著它經過良好的訓練並符合目的。模型可能不適用於所有情況,而且模型以驚人的速度改進,機器學習模型的正常睡眠在2到18個月之間,具體取決於應用場景。

機器學習信任問題的詳細分解

模型訓練過程中存在一些信任問題,Gensyn 目前正在努力產生有效的證明以促進這一過程。然而,本文主要關注模型推理過程。現在讓我們使用機器學習的四個建置模組來發現潛在的信任問題:

輸入:

資料來源是防篡改的

不輸入資料不被模型操作者竊取(隱私問題)

型號:

模型本身如宣傳的那樣準確

計算過程正確完成

參數:

模型參數沒有被改變或與宣傳一致

在此過程中,對模型所有者俱有模型價值的參數沒有洩漏(隱私問題)

輸出:結果可證明是正確的(可能遵循上述所有要素的改進和改進) 如何將ZK應用到機器學習信任框架中

其中一些信任問題可以透過上鍊來解決;將輸入和機器學習參數上傳到上鍊,並在上鍊計算模型,可以保證輸入、參數和模型計算的正確性。但這種方法可能會犧牲可擴展性性和隱私性。吉薩正在Starknet上進行這項工作,但由於成本問題,它僅支援像回歸這樣的簡單機器學習模型,不支援神經網路。 ZK技術可以更有效地解決上述信任問題。目前,ZKML的ZK通常指zkSNARK。首先,讓我們快速回顧一下zkSNARK的一些基本概念:

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用?

一個zkSNARK 證明是證明我知道一些秘密輸入w,使得這個計算f 的結果為OUT 是真實的,告訴而不是你w 是什麼。證明生成過程可以總結為以下步驟:

制定需要論證的陳述:f(x,w)=true

“我使用帶有導管參數的機器學習模型正確地對這個圖像進行了分類。”

將表示轉換為電路(算術化):不同的電路建構方法包括R1CS、QAP、Plonkish等。

與其他例子相比,ZKML需要一個額外的步驟,稱為量化。神經網路推斷通常使用浮點算術完成,而在算術電路的主要領域中模擬浮點算術非常昂貴。在精度和設備上不同的量化方法要求之間達到折衷。

一些像R1CS這樣的電路建構方法對神經網路來說效率不高。這部分可以調整以提高效能。

一個產生的證明密鑰和一個驗證密鑰

建立一個見證:當w=w*時,f(x,w)=true

創建一個哈希承諾:見證人w*承諾使用加密貨幣哈希函數產生一個哈希值。這個哈希值可以公諸於世。

這有助於確保在計算過程中,初始輸入或模型修改參數不會被竄改或修改。這一步至關重要,因為即使是重大的修改也可能對模型的行為和產生輸出產生影響。

生成證明:不同的證明系統使用不同的證明來產生演算法。

需要為機器學習操作設計特殊的零知識規則,如矩陣乘法和高效層,以便實現這些計算的子線性時間協定。

✓ 像groth16這樣的通用zkSNARK系統可能無法處理神經網絡,因為計算負載過大。

✓ 自2020年以來,許多新的ZK論證系統應運而生,以優化模型推理過程的ZK論證,包括vCNN、ZEN、ZKCNN和pvCNN。然而,它們中的大多數都針對CNN模型進行了最佳化。只能評價一些主要的資料集,如MNIST或CIFAR-10。

✓ 2022 年,Daniel Kang Tatsunori Hashimoto、Ion Stoica 和Yi Sun(Axiom 創始人)提出了一個基於Halo 2 的新證明方案,首次實現了針對ImageNet 數據集的ZK 證明生成。他們的最佳化主要中心化於算術化部分,具有用於非線性的創新參數和跨層重用子電路。

✓Modulus Labs正在為鏈上推理對不同的證明系統進行基準測試,但發現在證明時間方面,ZKCNN和plonky2表現最佳;在頂級證明者內存使用方面,ZKCNN和halo2表現良好;而plonky雖然表現良好,犧牲了記憶體消耗,而且ZKCNN僅適用於CNN模型。它還在開發一個專為ZKML設計的新zkSNARK系統,以及一個新的虛擬機器。

驗證證明:驗證者使用驗證金鑰進行驗證,消耗知道見證人的知識。

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用?

因此,我們可以證明將零知識技術評估機器學習模型可以解決許多信任問題。使用互動式驗證的類似技術可以達到類似的效果,但在驗證者方面需要更多資源,並可能面臨更多的隱私問題。值得注意的是,根據具體的模型,為它們產生證明可能需要時間和資源,在考慮技術最終評價現實世界的例子時,各方面將存在相應的折衷。

目前解決方案的現狀

接下來,現有的解決方案是什麼?請注意,模型提供者可能有很多不想產生ZKML 證明的原因。對於那些Brave嘗試ZKML 並且解決方案有意義的人,他們可以根據模型並輸入所在的位置選擇幾種不同的解決方案:

如果在鏈上輸入數據,可以考慮使用Axiom作為解決方案:

Axiom正在為以太坊建立零知識協處理器,以改善用戶對區塊鏈資料的存取並提供更複雜的數位化的鏈上資料視圖。在鏈上資料上進行可靠的機器學習計算是可行的:

首先,Axiom透過在其智慧契約AxiomV0中儲存以太坊區塊鏈加密的梅克爾根來導入鏈上數據,這些數據透過ZK-SNARK驗證過程進行無信任驗證。然後,AxiomV0StoragePf契約允許對AxiomV0中儲存的區塊鏈給予的信任根進行了歷史上以太坊儲存證明的批量驗證。

接下來,可以從匯入的歷史資料中擷取機器學習輸入資料。

然後,Axiom 可以在頂部應用經過驗證的機器學習操作;使用經過優化的halo2 作為監聽來驗證每個計算部分的有效性。

最後,Axiom 會附上每個查詢結果的zk 證明,並且Axiom 智能合約會驗證zk 證明。任何想要證明的相關方都可以從智能合約中存取它。

如果將模型放在鏈上,可以考慮使用RISCZero 作為解決方案:

首先,需要將模型的原始碼編譯成RISC-V二進位。當這個二進位檔案在ZKVM中執行時,會輸出一個包含加密貨幣密封的計算收據的模型。這個密封作為計算極限的零知識論點,將加密的imageID(識別執行的RISC-V二進位)與聲明的程式碼快速輸出關聯起來,以便於第三方驗證。

當模型在ZKVM 中執行時,關於狀態變更的計算完全在VM 內部完成。它不會向外部洩漏有關模型內部狀態的任何資訊。

一旦模型執行完畢,產生的密封就成為計算唯一的零知識證明。 RISC ZeroZKVM是一個RISC-V虛擬機,它可以產生本身執行的程式碼的零知識證明。使用ZKVM,可以產生一個加密貨幣收據,任何人都可以驗證該收據是由ZKVM 的客戶代碼產生的。發布收據時,不會洩露有關程式碼執行的其他資訊(例如,所提供的輸入)。

透過在RISC Zero 的ZKVM 中運行機器學習模型,可以證明模型涉及的有意計算是正確執行的。運算和驗證過程可以在使用者喜歡的環境中離線完成,或者在Bonsai Network 中完成,Bonsai Network 是一個通用的成交量起。

產生ZK證明的具體過程涉及到一個與隨機預言機作為驗證者互動的協議。 RISC零收據上的密封本質上就是這個交互協議的記錄。

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用?

如果你想直接從常用的機器學習軟體(例如考慮Tensorflow 或Pytorch)匯入模型,可以使用ezkl 作為解決方案:

首先,將最終模型匯出為.onnx文件,將部分樣本輸入匯出為.json文件。

然後,將ezkl 指向.onnx 和.json 文件,以產生可以證明ZKML 語句的ZK-SNARK 電路。

Ezkl 是一個函式庫和命令列工具,用於在zkSNARK 中進行深度學習模型和其他計算圖的推論。

Ezkl 的目標是提供一個抽象層,允許在Halo 2 電路中呼叫和佈局高階操作。 Ezkl 抽象化了複雜性,同時保持了非常高度的靈活性。他們的自訂模型具有自動量化的縮放因子。他們支援靈活地更改涉及的其他證明系統的新解決方案。他們也支援多種類型的虛擬機,包括EVM 和WASM。

關於論證系統,ezkl透過聚合論證(透過在裡面將難以驗證的論證轉換為容易驗證的論證)和稀疏(可以解決記憶體問題,但難以適應halo2)來客製化halo2電路。 Ezkl也透過和融合抽象(可以透過高級證明(減少開支)來優化整個流程。

意義在於,與其他通用zkml專案相比,Accessor Labs專注於為完全上鍊遊戲提供專門設計的zkml工具,可能涉及AI NPC、遊戲玩法的自動更新、涉及自然語言的遊戲介面等。

例子在哪裡

透過ZK 技術解決機器學習的信任問題意味著它現在可以識別更多「高風險」和「高度確定性」的例子,而不僅僅是與人們的對話保持同步或將貓的圖片與狗的圖片Web3已經在探索很多這樣的例子。這並不是巧合,因為大多數Web3 應用程式都在區塊鏈上運行或打算在區塊鏈上運行,這是因為區塊鏈具有特定的特性,可以安全運行,難以篡改,並具有確定性計算。一個可驗證的行為良好的AI應該是能夠在無信任和去中心化的環境中進行活動的AI,對吧?

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用?

Web3中可套用ZK+ML的範例

許多Web3應用程式為了安全性和去中心化而犧牲了使用者體驗,因為這顯然是它們的優先事項,而基礎設施的限制也存在。 AI/ML擁有豐富的用戶潛力,這無疑是有幫助的體驗,但以前在不退縮的情況下似乎是不可能的。現在,多虧了ZK,我們可以安心地看到AI/ML與Web3應用去的結合,而不會在安全性和中心化方面做太多犧牲。

從本質上講,這將是一個Web3應用程式(在編寫時可能存在或不存在),以消耗信任的方式實作ML/AI。在消耗信任的方式下,我們指的是它是否在消耗信任在環境/平台上運行,其操作是否可以被證明是可驗證的。請注意,並非所有ML/AI範例(或即使在Web3中)都需要消耗信任的方式運作。我們將分析在各種Web3領域中使用的ML功能的每個部分。然後,我們確定需要ZKML的部分,通常是人們願意為證明支付額外費用的高價值部分。以下提到的大多數例子/應用仍然是一個實驗研究階段。因此,它們的距離實際上還很遙遠。我們稍後會討論原因。

德菲

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用?

Defi 是區塊鏈協議和Web3 應用中為數不多的產品市場契合度證明之一。以許可的方式創建、儲存和管理財富和資本在人類歷史上是外部的。我們已經確定許多需要人工智慧/ML模型耗費許可地運作以確保安全性和去中心化的例子。

風險評估:現代金融需要AI/ML模型進行各種風險評估,從防止詐欺和洗錢到我們提供無保障的貸款。確保這種AI/ML模型以可驗證的方式運作意味著可以防止它們被匯集以實現審查制度,從而阻止使用Defi產品的產權許可。

資產管理:自動交易策略對傳統金融和Defi 來說並不新鮮。已經有人嘗試應用AI/ML 產生的交易策略,但只有極少數去中心化的策略取得了成功。目前Defi 領域的典型應用包括Modulus Labs Rocky Bot 的實驗。

一個在L1上持有資金並在Uniswap上交易所WEth / USDC的合約。

一個L2合約實現了一個簡單(但靈活)的三層神經網絡,用於預測未來的WEth價格。合約使用歷史WETH價格資訊作為輸入。

一個簡單的前端用於視覺化以及用於訓練回歸器和分類器的PyTorch 程式碼。

這適用於ML信任框架的「輸出」部分。輸出是在L2上產生的,傳輸到L1,並用於執行。在此過程中,不會被篡改。

這適用於“輸入”和“模型”部分。歷史價格資訊輸入來自區塊鏈。模型的執行是在CairoVM(一種ZKVM)中計算的,其執行追蹤將產生一個用於驗證的ZK 證明。

Rocky Bot:Modulus Labs 在StarkNet 上使用AI 進行決策創建了一個交易機器人。

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用?

自動化MM和流動性供應:

本質上,這是風險評估和資產管理中進行的類似努力的結合,只是在交易量、時間軸和資產類型方面採用了不同的方式。關於如何在股市中利用ML進行做市的研究論文有很多。在一些研究結果適用於Defi 產品可能只是時間問題。

例如,LyraFinance 正與Modulus Labs 合作,透過智慧功能提升其AMM,使得資本利用效率更高。

榮譽提名:

Warp.cc 團隊開發了一個教程項目,介紹如何部署一個運行訓練良好的神經網路以預測比特幣價格的智慧合約。這符合我們框架的「輸入」和「模型」部分,因為輸入使用RedStoneOracles 提供的數據,模型作為一個Warp 智能合約在Arweave 上執行。

這是第一次迭代並涉及ZK,所以它屬於我們的考慮指定,但在未來,Warp 團隊實現了一個ZK 部分。

遊戲

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用?

遊戲與機器學習有許多交集:這樣的灰色區域代表了我們對遊戲部分中的機器學習功能是否需要與相應的ZKML 證明配製的初步評估。 Leela Chess Zero 等於ZKML 評估遊戲的一個非常有趣的例子:

人工智慧代理

LC0和集體輪流進行遊戲(正如像棋中應有的那樣)。

LC0的移動是透過簡化的、適合電路的LC0模型計算出來的。

Leela Chess Zero (LC0):由Modulus Labs 建造的一款完全基於鏈上的AI 棋手,與來自社區的一群人類玩家對戰。

LC0的移動有一個Halo2 snark證明,以確保沒有人類智囊團的干預。只有簡化的LC0模型在那裡做決策。

這符合“模型”部分。模型的執行有一個ZK證明,以驗證計算沒有被竄改。

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用?

數據分析與預測:這一直是Web2遊戲世界中AI/ML的常見用途。然而,我們發現在這個ML過程中實現ZK的理由非常少。為了不讓過多的價值直接涉及這個過程,這可能然而,如果某些分析和預測被用於為用戶確定獎勵,那麼ZK 可能會被實施並確保結果是正確的。

榮譽提名:

AI Arena 是一款以太坊原創遊戲,來自世界各地訓練的玩家可以在其中設計、和戰鬥由人工神經網路驅動的NFT 角色。來自世界各地人才橫溢的研究人員相打造最佳機器學習(ML)模型來參與遊戲戰鬥。 AI Arena主要關注前饋神經網路。整體來說,它們的運算支出比神經網路(CNNs)或循環神經網路(RNNs)低。儘管如此,目前模型只在完成訓練後上傳到平台,因此值得一提。

GiroGiro.AI正在建立一個AI工具包,使能夠為個人或商業用途創建人工智慧。使用者可以根據仔細分析自動化的AI工作流程平台創建各種類型的AI系統。只要輸入少量資料並選擇演算法(或用於改進的模型),使用者就可以產生並利用心中的AI模型。雖然該項目處於非常早期的階段,但我們非常期待看到GiroGiro可以為遊戲金融和元宇宙為重點的產品帶來什麼,因此將其榮譽提名。

確實和社交

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用?

在DID 和社交領域,Web3 和ML 的交叉點目前主要體現在人類論證和蠟燭論證領域;其他部分可能會發展,但需要更長的時間。

人類證明

用戶的應用程式在本地生成一個錢包地址。

應用程式使用信號量證明它擁有註冊的一個預設的私鑰。因為這是零知識證明,所以程式不會弄清楚是哪個預設。

證明再次發送到順序器,順序器驗證證明並啟動將代幣存入提供的錢包地址的過程。稱的零件隨證明發送,確保用戶不能一起獲得兩次獎勵。

用戶在手機上產生一個信號量叉對,並透過二維碼向Orb提供哈希後的圖示。

Orb 掃描使用者的虹膜並在本地計算使用者的IrisHash。然後,將包含哈希執行緒和IrisHash 的簽章訊息傳送到註冊順序節點。

順序節點驗證Orb 的簽名,然後檢查IrisHash 是否與資料庫中存在相符。如果唯一性檢查通過,IrisHash 和蠟燭將被保存。

世界幣使用一種名為Orb 的裝置來判斷某人是否是真實存在的人,而不是試圖進行詐欺驗證。它透過各種網路頭感測器和機器學習模型分析臉部和虹膜特徵來實現這一目標。一旦做出於這個判斷,Orb就會拍攝一組人的虹膜照片,並使用多個機器學習模型和其他電腦視覺創建虹膜編碼,這是一個表示個體虹膜圖案最重要特徵的數位表示。具體的註冊步驟如下:

Worldcoin 使用開源的Semaphore 零知識證明系統將IrisHash 的唯一性轉換為使用者帳戶的唯一性,而不是將它們關聯起來。這確保新註冊的用戶可以成功領取他/她的WorldCoins。步驟如下:

WorldCoin 使用ZK 技術確保其ML 模型的輸出不會洩露用戶的個人數據,因為它們之間沒有關聯。在這種情況下,它屬於我們信任框架的「輸出」部分,因為它保證了預期的輸出傳輸方式和使用方式,在這種情況下是暴露的。

從某個角度重新使用ML信任框架

可以看到,Web3中ZKML的潛在實例尚處於起步階段,但不能被重視;未來,隨著ZKML使用的不斷擴大,可能會出現對ZKML的需求高峰,形成下圖中的閉環:

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用?

ZKML 服務首先主要關注ML 信任框架的「模型」和「參數」部分。儘管我們現在看到的大部分與「參數」相關的更多是「模型」相關。需要注意的是,「輸入」和「輸出」部分更多是基於區塊鏈的解決方案,無論是作為資料來源還是資料目的地。單獨使用ZK或區塊鏈可能無法實現完全的可信度,但它們聯合起來可能會實現。

大規模應用還有多遠?

最後,我們可以關註一下ZKML 的目前吸力狀態,以及我們離ZKML 大規模應用還有多遠。

Modulus Labs 的論文透過測試Worldcoin(具有嚴格的準確性和記憶體需求)和AI Arena(具有成本效益和一些時間要求)為我們提供了關於ZKML 應用感知的數據和感知:

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用?

如果Worldcon 使用ZKML,證明者的記憶體消耗將超過任何行動硬體的承受能力。如果AI Arena 的比賽使用ZKML,使用ZKCNN 帶來的時間和成本增加100 倍(0.6 s 比較原來的0.008 s)。所以遺憾是的,這兩者都不適合直接應用ZKML 技術來證明時間和證明者記憶體使用。

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用?

證明大小和驗證時間呢?我們可以參考Daniel Kang、Tatsunori Hashimoto、Ion Stoica 和Yi Sun 的論文。如下所示,他們在ImageNet 上的DNN 推理解決方案(模型類型:DCNN,16 層,3.4 百萬參數) )上的準確率可以達到79%,同時驗證時間表格秒數10 ,證明大小為5952 字節。此外,zkSNARKs 可以縮小到59% 準確率時驗證時間表格0.7 秒。這些結果證明,在證明大小和驗證時間方面,對ImageNet 規模的模型進行zkSNARKing 是可行的。目前主要的技術瓶頸證明了時間和記憶體消耗。在web3 案例中應用ZKML 在技術上尚不可行。 ZKML 是否有潛力趕上AI 的發展?我們可以比較幾個經驗數據:

機器學習模型的發展速度:2019年發布的GPT-1模型有1.5億個參數,而2020年發布的最新GPT-3模型有1,750億個參數,僅兩年間參數數量就增加了1,166倍。

零知識系統的最佳化速度:零知識系統的表現成長基本上遵循「摩爾律」的動作。幾乎每年都會出現新的零知識系統,我們預期證明者表現的快速成長會在一段間歇期持續。

深度解析ZKML:零知識證明和區塊鏈如何在人工智慧和機器學習領域發揮作用?

從這些數據來看,雖然機器學習模型的發展速度非常快,但零知識證明系統的最佳化速度正在開始提升。在未來一段時期,ZKML 可能會初始階段趕上AI 的發展,但它需要不斷地進行技術創新和優化以縮小差距。這意味著,儘管目前ZKML在web3應用中存在技術瓶頸,但隨著零知識證明技術的不斷發展,我們的興奮期待ZKML在未來能夠在web3場景中對比前沿的ML與ZK的改進率,前景並不是十分樂觀。不過,隨著底層性能、ZK硬體的不斷完善,以及基於高度格式化的神經網路操作而定製的ZK證明系統,希望ZKML的發展能夠滿足web3的需求,首先從提供一些改造的機器學習功能開始。雖然我們可能很難用區塊鏈+ZK來驗證ChatGPT回饋給我的資訊是否可信,但我們或許可以在ZK Circuit 中安裝一些較小且較舊的ML 模型。

結論

「權力趨向腐敗,而絕對的權力使人絕對腐敗」。隨著人工智慧和機器學習的強大,目前還沒有萬無一失的方法將其治理之下。事實一再證明,政府或提供高級幹預的後遺症,或提前徹底禁止。區塊鏈+ZK提供了為數不多的解決方案,能夠以可證明和可修復的方式馴服野獸。

我們在ZKML領域看到更多的產品創新,ZK和區塊鏈為AI/ML的運作提供了一個安全且值得信任的環境。我們也期待這些產品創新產生全新的商業模式,因為在無許可在加密貨幣世界裡,我們不受這裡的去SaaS商業化模式的限制。我們期待支持更多的建設者,在這個「西部荒野無狀態」和「象牙塔精英」的迷人重疊中,來建立他們令人興奮的想法。我們仍處於早期階段,但我們可能已經在拯救世界的路上。

資訊來源:0x資訊編譯自網際網路。版權歸作者SevenX Ventures所有,未經許可,不得轉載

Total
0
Shares
Related Posts