Scroll聯合創始人：如何從0到1構建zkEVM？

原文：Ye Zhang

編譯：FF

演講分成四個部分，第一部分張燁介紹了開發背景以及我們為什麼首先需要zkEVM以及為什麼它在最近兩年間變得如此受歡迎，第二部分通過一個完整的流程，講解如何從頭開始構建zkEVM包括算術化和證明系統，第三部分通過一些有趣的研究問題來談論了Scroll 在構建zkEVM時遇到的問題，最後介紹了一些其他使用zkEVM的應用。

Scroll聯合創始人：如何從0到1構建zkEVM？

背景和動機

Scroll聯合創始人：如何從0到1構建zkEVM？

傳統的Layer 1 區塊鏈會有一些節點通過P2P網絡共同維護。他們在收到用戶的交易時，會在EVM的虛擬機內執行，讀取調用合約和存儲，並依照交易更新全局的狀態樹。

Scroll聯合創始人：如何從0到1構建zkEVM？

這樣的架構的優勢在於去中心化和安全性，缺陷就是在L1上的交易手續費昂貴，並且交易確認緩慢。

Scroll聯合創始人：如何從0到1構建zkEVM？

ZK-Rollup的架構中，L2 網絡只需將數據和驗證數據正確性的證明上傳至L1，其中證明通過零知識證明電路計算而來。

Scroll聯合創始人：如何從0到1構建zkEVM？

在早期的ZK-Rollup中，電路是針對特定應用而設計，用戶需要將交易發送給不同的證明者，然後不同應用的ZK-Rollup再將自己的數據和證明提交至L1。這樣帶來的問題是，喪失了原先L1 合約的可組合性。

Scroll聯合創始人：如何從0到1構建zkEVM？

Scroll 所要做的是原生的zkEVM方案，是一種通用型的ZK-Rollup。這樣不僅對用戶而言更友好，對於開發者而言也可以獲得在L1上的開發體驗。當然這背後的開發難度非常之大，並且現在的證明生成的代價也非常高。

Scroll聯合創始人：如何從0到1構建zkEVM？

幸運的是，零知識證明的效率在過去兩年裡已經大幅提高了，這也是為什麼在最近兩年zkEVM變得如此受歡迎。至少有四個原因讓它變得可行，第一是多項式承諾的出現，在原先Groth16證明系統下，約束的規模非常之龐大，而多項式承諾可以支持更高階的約束，縮小證明規模；第二是查找表和自定義門的出現，可以支持更靈活的設計，使證明更加高效；第三是硬件加速方面的突破，通過GPU，FPGA和ASIC可以將證明時間縮短1-2個數量級，第四是在遞歸證明下，可以將多個證明壓縮成一個證明，使得證明變得更小更易於驗證。所以結合這四個因素，零知識證明的生成效率要比兩年前高出三個數量級，這也是Scoll 的起源。

Scroll聯合創始人：如何從0到1構建zkEVM？

根據Justin Drake的定義，zkEVM可以分為三類，第一類是語言級別的兼容，主要原因是EVM不是為ZK而設計，有很多對ZK不友好的操作碼，因此會造成大量的額外開銷。因此像Starkware和zkSync選擇在語言層面將Solidity或者Yul編譯到ZK友好的編譯器中。

第二類是Scroll 在做的字節碼層面的兼容，是直接證明EVM的字節碼處理正確與否，直接繼承了以太坊的執行環境。在這裡可做的一些取捨是，使用和EVM不一樣的狀態根，例如使用ZK友好的數據結構。 Hermez 和Consensys 也在做類似的事情。

第三類是共識層面的兼容，這裡的取捨在於不僅需要保持EVM 不變，還包括儲存結構等實現以太坊完全兼容，代價是需要更長的證明時間。而Scroll 正在和以太坊基金會的PSE 團隊合作構建，來實現以太坊的ZK化

Scroll聯合創始人：如何從0到1構建zkEVM？

從0 到1 構建zkEVM

Scroll聯合創始人：如何從0到1構建zkEVM？

第二部分，張燁向大家展示瞭如何從零開始建立ZKVM。

完整流程

首先，在ZKP的前端部分，你需要通過數學的算術化來表示你的計算，最常用的就是線性的R1CS，以及Plonkish 和AIR。通過算術化得到約束後，在ZKP的後端你需要運行證明算法，來證明計算正確性，這裡列舉了最常用的多項式交互式諭示證明(Polynomial IOP) 和多項式承諾方案(PCS)。

Scroll聯合創始人：如何從0到1構建zkEVM？

在這裡我們需要證明zkEVM，Scroll 使用的是Plonkish，Plonk IOP，以及KZG的組合。

Scroll聯合創始人：如何從0到1構建zkEVM？

為了理解我們為什麼使用這三者的方案。我們首先從最簡單的R1CS 開始，R1CS中的約束，是線性組合乘以線性組合等於線性結合。你可以加上任何變量的線性組合而沒有額外的開銷，但是在每個約束中階數最大是2。因此對於階數較高的運算，需要的約束就越多。

Scroll聯合創始人：如何從0到1構建zkEVM？

而在Plonkish 中，你需要將所有的變量填入表格，包括輸入，輸出以及中間變量的見證。在此之上，你可以定義不同的約束。在Plonkish 中有三種類型的約束可以使用。

Scroll聯合創始人：如何從0到1構建zkEVM？

第一種約束是自定義門（Custom Gate），你可以定義不同單元格之間的多項式約束關係，例如va3 * vb3 * vc3 – vb4 =0。相比R1CS來說，階數可以更高，因為你可以定義任何一個變量的約束，並且可以定義一些非常不一樣的約束。

Scroll聯合創始人：如何從0到1構建zkEVM？

第二種約束是Permuation，即等價性校驗(equality checks)。可以用來檢查不同單元格的等價性，常用於關聯電路中的不同門，比如證明上一個門的輸出等於下一個門的輸入。

Scroll聯合創始人：如何從0到1構建zkEVM？

最後一種約束是查找表(Lookup Table)。我們可以將查找表理解成變量之間存在一個關係，該關係可以表示成一個表。例如我們想要證明vc7 在0-15 範圍內，在R1CS中你首先需要把這個數值分解為4位二進制，然後證明每位在0-1的範圍內，這將需要四個約束。而在Plonkish中，你可以將所有可能的範圍列在同一列，只需要證明vc7屬於該列即可，這對范圍證明非常高效，在zkEVM中，查找表對於證明內存讀寫非常有用。

Scroll聯合創始人：如何從0到1構建zkEVM？

小結一下，Plonkish 同時支持自定義門，等價性校驗和查找表，可以非常靈活的滿足不同的電路需要。簡單對比下STARK，STARK中每一行是一個約束，約束需要表示行與行之間的狀態轉換，但Plonkish 中的自定義約束靈活性顯然更高。

Scroll聯合創始人：如何從0到1構建zkEVM？

現在的問題是在zkEVM中，我們如何選擇前端。對於zkEVM主要有四個挑戰。第一個挑戰是EVM的字段是256位，這意味著需要高效得對變量進行範圍約束；第二個挑戰是EVM有很多ZK不友好的操作碼，因此需要非常大規模的約束來證明這些操作碼，例如Keccak-256；第三個挑戰是內存讀寫問題，你需要一些有效的映射來證明你所讀取的和之前所寫入的是一致的；第四個挑戰是EVM的執行踪跡是動態變化的，因此我們需要自定義門來適配不同的執行踪跡。出於上述的考慮，我們選擇了Plonkish。

Scroll聯合創始人：如何從0到1構建zkEVM？

接下來，我們看zkEVM的完整流程，基於初始的全局狀態樹，一筆新的交易進來後，EVM會讀取存儲和調用的合約的字節碼，根據交易生成相應的執行踪跡例如PUSH, PUSH, STORE, CALLVALUE，然後逐步執行更新全局狀態，得到交易後的全局狀態樹。而zkEVM是將初始的全局狀態樹，交易本身，以及交易後的全局狀態樹作為輸入，根據EVM的規範，來證明執行踪蹟的執行正確性。

Scroll聯合創始人：如何從0到1構建zkEVM？

深入EVM電路細節，每一步執行踪跡都有對應的電路約束。具體來說，每一步的電路約束包含Step Context，Case Switch，Opcode Specific Witness。 Step Context 包含執行踪跡對應的codehash，剩餘gas和計數器；Case Switch 包含所有的操作碼，所有的錯誤情況，以及該步的相應操作；Opcode Specific Witness 包含了操作碼所需的額外見證，例如運算數等。

Scroll聯合創始人：如何從0到1構建zkEVM？

以簡單的加法為例，需要確保加法的操作碼的控制變量sADD設置為1，其他操作碼控制變量均為零。在Step Context 中，通過設置gas’ – gas – 3 = 0 來約束消耗的gas 等於3，同理約束計數器，棧指針在該步後累加1；在Case Switch 中，通過操作碼控制變量和為1來約束該步為加法操作；在Opcode Specific Witness 中，對運算數的實際加法進行約束。

Scroll聯合創始人：如何從0到1構建zkEVM？

此外還需要額外的電路約束，來保證運算數從內存讀取的正確性。這裡我們首先需要構建一個查找表來證明運算數屬於內存。並通過內存電路(RAM Circuit)來驗證內存表的正確性。

Scroll聯合創始人：如何從0到1構建zkEVM？

同樣的方法可以適用於zk不友好的哈希函數，構建哈希函數的查找表，將執行踪跡中的哈希輸入和輸出映射到查找表，利用額外的哈希電路(Hash Circuit) 來驗證哈希查找表的正確性。

Scroll聯合創始人：如何從0到1構建zkEVM？

現在我們來看zkEVM的電路架構，核心的EVM電路用於約束執行踪跡每一步的正確性，在一些EVM電路約束難度較大的地方，我們通過查找表來映射，包括Fixed Table, Keccak Table, RAM Table, Bytecode, Transaction, Block Context，然後利用單獨的電路來約束這些查找表，例如Keccak 電路用於約束Keccak 表。

Scroll聯合創始人：如何從0到1構建zkEVM？

小結一下，zkEVM的完整工作流如下圖所示。

Scroll聯合創始人：如何從0到1構建zkEVM？

證明系統

因為在L1上直接驗證上述的EVM電路，內存電路，存儲電路等，開銷巨大，Scroll 的證明系統採用了兩層架構。

第一層負責直接證明EVM本身，需要大量的計算來生成證明。因此第一層證明系統要求支持自定義門和查找表，對硬件加速友好，在低峰值內存下並行生成計算，且驗證電路規模小，可以快速驗證。有前景的可選方案包括Plonky2，Starky，eSTARK，它們前端基本上都使用Plonk，但後端可能使用了FRI，並且都滿足上述的四個特性。另一類可選的方案包括Zcash所開發的Halo2，以及KZG版本的Halo2。

還有一些新的證明系統也有很有前景，例如最近移除了FFT 的HyperPlonk，而NOVA證明系統可以做到更小的遞歸證明。但它們在研究中只支持R1CS，如果他們未來可以支持Plonkish 並且應用於實踐，將非常實用高效。

Scroll聯合創始人：如何從0到1構建zkEVM？

第二層證明系統用於證明第一層證明的正確性，需要可以在EVM中高效進行驗證，理想情況下，最好也是硬件加速友好並且支持transparent或者universal setup。有前景的可選方案包括Groth16和列數較少的Plonkish證明系統。 Groth16仍然是目前研究中證明效率極高的代表，而Plonkish證明系統在列數較少的情況下，也可以達到較高的證明效率。

Scroll聯合創始人：如何從0到1構建zkEVM？

在Scroll，我們在兩層證明系統中我們都採用了Halo2-KZG證明系統。因為Halo2-KZG可以支持自定義門和查找表，在GPU硬件加速下性能良好，且驗證電路規模小，可以快速驗證。區別在於我們在第一層證明系統中我們使用了Poseidon哈希，進一步提高證明效率，而第二層證明系統因為直接在以太坊上驗證，仍然使用了Keccak 哈希。 Scroll 也在探索多層證明系統的可能性，來進一步聚合第二層證明系統生成的聚合證明。

Scroll聯合創始人：如何從0到1構建zkEVM？

當前實現下，Scroll 的第一層證明系統EVM電路有116 列，2496 個自定義門，50 個查找表，最高階數為9，1M Gas下需要2^18行；而第二層證明系統的聚合電路僅有23 列，1個自定義門，7 個查找表，最高階數為5 ，為了聚合EVM電路，內存電路，存儲電路，需要2^25行。

Scroll聯合創始人：如何從0到1構建zkEVM？

Scroll 在GPU 硬件加速方面也做了非常多的研究和優化工作，對於EVM電路，優化後的GPU證明者僅需30s，相較CPU證明者提升了9倍的效率；而對於聚合電路，優化後的GPU證明者僅需149s，相較CPU提升了15倍的效率。在當前的優化條件下， 1M Gas 第一層證明系統大約需要2 分鐘，第二層證明系統大約需要3 分鐘。

Scroll聯合創始人：如何從0到1構建zkEVM？

有趣的研究問題

Scroll聯合創始人：如何從0到1構建zkEVM？

第三部分，張燁談論了一些Scroll 在構建zkEVM 過程中有趣的研究問題，從前端的算術化電路到證明者的實現。

電路

首先是電路中的隨機性，因為EVM 字段是256位，我們需要將其拆分成32 個8 位的字段，從而更高效得進行範圍證明。隨後我們使用隨機線性組合(Random Linear Combination, RLC)的方法，利用隨機數將32個字段編碼成1個，只需要驗證該字段就可以驗證原始的256位字段。但是問題在於隨機數的生成需要在拆分字段之後，才能確保不被篡改。因此Scroll 和PSE 團隊提出了多階段證明者的方案，來確保在字段拆分之後，再利用隨機數生成RLC，該方案被封裝在了Challenge API 中。 RLC在zkEVM中有許多應用場景，不僅可以壓縮EVM字段成一個字段，也可以加密不定長的輸入，或是優化查找表的佈局，但仍然有許多開放性的問題需要解決。

Scroll聯合創始人：如何從0到1構建zkEVM？

電路方面第二個有趣的研究問題是電路佈局。 Scroll 前端之所以採用Plonkish，是因為EVM的執行踪跡是動態變化的，需要能支持不同的約束，變化的等價性檢驗，而R1CS的標準化門需要更大的電路規模來實現。但Scroll 目前使用了2000 多個自定義門來滿足動態變化的執行踪跡，也在探索如何進一步優化電路佈局，包括將Opcode 拆分成Micro Opcode，或是複用相同表格內的單元格。

Scroll聯合創始人：如何從0到1構建zkEVM？

電路方面第三個有趣的研究問題是動態規模。因為不同的操作碼的電路規模不同，但為了滿足動態變化的執行踪跡，每一步的操作碼都需要滿足最大的電路規模，例如Keccak哈希，因此我們實際上付出了額外的開銷。假設我們可以使zkEVM動態適應動態變化的執行踪跡，這將節省不必要的開銷。

Scroll聯合創始人：如何從0到1構建zkEVM？

證明者

在證明者方面，Scroll 在GPU 加速上已經對MSM和NTT進行了大量的優化，但現在的瓶頸轉移到了見證生成和復制數據這塊。因為假設MSM和NTT佔據了80%的證明時間，即使硬件加速可以將這部分效率提升若干個數量級，但原先見證生成和復制數據20%的證明時間將變成新的瓶頸所在。證明者的另一個問題是需要大量的內存，因此也需要探索更便宜更去中心化的硬件方案。

Scroll聯合創始人：如何從0到1構建zkEVM？

同時Scroll 也在探索硬件加速和證明算法方面，來提升證明者的效率。目前主要有兩個大方向，或是切換至更小的域，例如使用64位的Goldilocks域，32位的梅森數（Mersenne Prime）等，或是堅持基於橢圓曲線（EC）的新證明系統，例如SuperNova。當然也有其他的一些別的可能路徑，歡迎有想法的朋友直接聯繫Scroll。

Scroll聯合創始人：如何從0到1構建zkEVM？

安全性

在構建zkEVM時，安全性是至關重要的。 PSE 和Scroll 共同構建的zkEVM有大約3萬4千行代碼，從軟件工程角度，這些複雜的代碼庫在很長一段時間內是不可能沒有漏洞的。 Scroll 目前在通過大量的審計，包括業內最頂尖的審計公司，來審核zkEVM 的代碼庫。

Scroll聯合創始人：如何從0到1構建zkEVM？

其他使用zkEVM的應用

Scroll聯合創始人：如何從0到1構建zkEVM？

第四部分探討了其他一些使用了zkEVM的應用。

在zkRollup的架構中，我們通過在L1的智能合約，來驗證在L2 上的n筆交易是有效的。

Scroll聯合創始人：如何從0到1構建zkEVM？

如果我們直接驗證L1的區塊，那麼L1的節點就不需要重複執行交易，只需要驗證每一個區塊證明的有效性。這樣的架構方案稱為Enshrine Blockchain。目前在以太坊上直接實現難度非常之大，因為需要驗證整個以太坊區塊，其中會包括驗證大量簽名，隨之帶來更長的證明時間和更低的安全性。當然也已經有一些其他公鏈在通過遞歸證明，使用單個證明，來驗證整個區塊鏈，例如Mina。

Scroll聯合創始人：如何從0到1構建zkEVM？

因為zkEVM可以證明狀態轉換，它也可以被白帽所利用，來證明自己知道某些智能合約的漏洞，尋求項目方的賞金。

Scroll聯合創始人：如何從0到1構建zkEVM？

最後一個用例是，是通過零知識證明來證明對歷史數據的聲明，作為預言機來使用，目前Axiom正在做這方面的產品。最近的ETHBeijing 黑客鬆上，GasLockR團隊正是利用了這一特性，證明了歷史的Gas開銷。

Scroll聯合創始人：如何從0到1構建zkEVM？

最後，Scroll 正在構建zkRollup的以太坊通用擴容解決方案，使用了非常先進的算術化電路和證明系統，並且通過硬件加速構建快速的驗證器，證明遞歸。目前Alpha測試網已經上線，並穩定運行了很長時間。

當然仍然有一些有趣的問題需要解決，包括協議設計和機制設計，零知識工程和實際效率，歡迎大家加入Scroll一起構建！

Scroll聯合創始人：如何從0到1構建zkEVM？

Scroll聯合創始人：如何從0到1構建zkEVM？

背景和動機

從0 到1 構建zkEVM

有趣的研究問題

其他使用zkEVM的應用

資深分析師預測Shiba INU價格將在$0.00017到$0.00032之間快速上漲

加密貨幣市場在大幣下跌時呈現混合信號

德銀：貝森特的降息觀點與美聯儲模型相悖

扎克伯格計劃再次重組Meta的人工智能業務

現在XRP錢包94%被出售，但這或許會有所不同的原因在於此

失去上漲趨勢後，比特幣攤位超過$112,000

索拉納新聞：Solana 達到100,000 TP

《社交網絡》中的不幸雙子兄弟，成功炒幣與上市

Scroll聯合創始人：如何從0到1構建zkEVM？

背景和動機

從0 到1 構建zkEVM

有趣的研究問題

其他使用zkEVM的應用

Related Posts