概述
zk-Rollup 是一種非常便宜且安全的以太坊二層擴展解決方案。然而,現有的zk-Rollup 只限於特定應用程序使用,這使得開發人員在zk-Rollup 中構建通用的可組合DApp 和遷移現有應用程序變得困難。我們通過引入zkEVM 生成zk 證明用於EVM 驗證來構建完全兼容EVM 的zk-Rollup,任何以太坊應用程序都可以輕鬆遷移到該zk-Rollup。
本文介紹zkEVM 的設計挑戰以及可行性,並提出了從零開始構建zkEVM 的詳細方案。
背景
zk-Rollup是公認的以太坊最佳擴容解決方案。不僅具有以太坊Layer 1 的安全性,並且與所有其他Layer 2 解決方案相比,交易速度最快。
從中長期來看,隨著ZK-SNARK 技術的改進,ZK rollups 將在所有用例中勝出。 — Vitalik Buterin
zk-Rollup 的基本理念是將大量交易聚合到一個Rollup 塊中,並為鏈下的塊生成簡潔的證明。然後Layer 1 上的智能合約只需要驗證zk-Rollup的證明並直接更新狀態,無需重新執行那些交易。證明驗證狀態比重新執行計算的gas 費用便宜很多,另外數據壓縮(即只保留最少的鏈上數據進行驗證)利於降低gas 費用,這樣的交易流程節省一個數量級的gas 費用。
儘管zk-Rollup 安全高效,但很難構建通用DApp,其應用仍僅限於支付和互換(swap),主要是以下兩個原因:
首先,在zk-Rollup 中開發DApp 需要使用特殊的編程語言(即R1CS )來編寫智能合約的邏輯。該編程語言的語法複雜,而且要求開發者精通零知識證明。
其次,當前的zk-Rollup 不支持可組合性[1]。這意味著多個的zk-Rollup 應用程序不能在Layer 2 內相互交互,極大地降低了DeFi 應用程序的可組合性。
簡而言之,目前zk-Rollup 對開發人員不友好並且功能有限。我們希望解決這些問題,通過直接支持原生EVM 驗證,為開發人員提供快速開發體驗,支持Layer 2 內應用程序的可組合性,以便現有的以太坊應用程序可以輕鬆遷移到zk-Rollup 上。
在zk-Rollup 中構建通用DApp
在zk-Rollup 中有兩種構建通用DApp 的方法。
-
為不同的DApp 構建專用電路(“ASIC”)
-
為智能合約執行構建一個通用的“EVM”編碼
“ 電路(circuit)”是指零知識證明中使用的程序表示方法。例如,如果要證明hash(x) = y,則需要使用ASIC 電路重新編寫散列函數。電路只支持非常有限的計算表達式(例如R1CS 只支持加法(add)和乘法(mul))。因此,開發人員使用電路語言編寫程序的過程非常困難,必須使用add 和mul 構建所有程序邏輯(包括if else、循環等)。
第一種方法要求開發人員為不同的DApp 設計專門的“ASIC”電路,這需要使用零知識證明最原始的方式。通過設計定制電路減少每個DApp 的成本。然而,由於電路是“靜態的”,不能為應用提供可組合性,並且需要專業的電路設計知識,因此開發體驗很糟糕[2]。
第二種方法不需要任何特殊的設計或電路專業知識。這種基於機器證明的高級思想讓任何程序可以在CPU 上運行,因此開發者只需要構建一個通用的CPU 電路來驗證底層步驟。然後使用這個CPU 電路來驗證程序的執行。在此場景中,程序指的是智能合約,CPU 則是EVM。但是,由於成本過高,過去幾年並沒有普遍採用這種方法。例如,即使開發者只想增加一個驗證步驟,就需要承擔整個EVM 電路的成本。如果執行跟踪中有數千個步驟,那麼EVM 電路成本將是1000 倍。[3]
最近,有很多研究在按照這兩種方法優化zk 證明,包括:
(i)提議新的零知識證明友好型語言Poseidon hash ,其在電路中的效率是SHA256 的100 倍
(ii)通用可驗證虛擬機,如TinyRAM
(iii)) 越來越多的通用優化技巧,如Plookup,以及運行速度更快的密碼學庫。
我們之前建議為每個DApp 設計“ASIC”電路,通過驗證密碼進行通信。但是,根據社區的反饋,我們改變了優先級,將重點關注在第二種方法,優先構建通用EVM 電路(所謂的“zkEVM”)。 zkEVM 將支持與Layer 1 完全相同的開發體驗。我們不會將底層設計的複雜性留給開發人員,而是通過定制的EVM 電路設計來解決效率問題。
zkEVM 的設計挑戰
zkEVM 很難構建,與TinyRAM 不同,zkEVM 的設計和實現更具挑戰性,原因如下:
首先,EVM 對橢圓曲線的支持有限。目前,EVM 僅支持BN254 配對,不直接支持循環橢圓曲線,因此很難進行遞歸證明。其他專用協議在此限制下也很難使用,除非是EVM 兼容的驗證算法。
其次,EVM 字長為256 位。 EVM 在256 位整數上運行(大多數常規VM 在32-64 位整數上運行),而zk 證明在素數字段上工作。在電路內部進行“不匹配場算術”需要範圍證明,這將在每個EVM 步驟中增加大概100 個約束,導致EVM 電路尺寸擴大兩個數量級。
第三,EVM 有很多特殊的操作碼。 EVM 與傳統VM 不同的是有許多特殊的操作碼,例如CALL,還有執行上下文和gas 相關的錯誤類型。這將給電路設計帶來新的挑戰。
第四,EVM 是基於堆棧的虛擬機。 SyncVM ( zksync ) 和Cario (starkware) 架構在基於寄存器的模型,並定義了特定的IR/AIR。需要專門的編譯器將智能合約代碼編譯成新的zk 友好的IR。這種方法是語言兼容而不是原生EVM 兼容,基於堆棧的模型和直接支持原生工具鏈更難實現。
第五,以太坊存儲佈局的成本太大。以太坊存儲佈局高度依賴Keccak 和MPT [4],它們都不是zk 友好類型,並且會產生高昂的成本。例如,Keccak 哈希的電路大小是Poseidon hash 的1000 倍。但是,如果將Keccak 替換為另一個哈希,則會對現有的以太坊基礎設施造成一些兼容性問題。
第六,基於機器的證明有高昂的成本。即使能夠妥善處理上述所有問題,仍然需要找到一種有效的方法將它們組合在一起以獲得完整的EVM 電路。正如我在上一節中提到的,簡單的操作碼add可能會導致整個EVM 電路的成本。
為什麼zkEVM 有可能實現?
感謝研究人員在這方面取得的巨大進步,近兩年來解決的效率問題越來越多,證明了zkEVM 的可行性!主要的技術進步來自以下幾個方面:
多項式承諾(polynomial commitment)的使用。在過去的幾年裡,大多數零知識證明協議都在使用R1CS,PCP 查詢被編碼到了特定於應用的受信任起步設置(trusted setup)中。 。這種情況通常會使電路會超出負載,並且無法進行自定義優化,因為每個約束的程度需要為2(雙線性配對(bilinear pairing)僅允許指數中的一次乘法)。開發者使用多項式承諾方案可以通過通用設置(universal setup)或者透明設置(transparent setup)將約束提升到任何程度,大幅提高後端的選擇的靈活性。
數據表查詢參數和自定義小工具。優化數據表查詢參數首先由Arya 中提出,然後在Plookup 中進行優化。這可以為zk 不友好的編程語句(例如AND、XOR 等)省略很多按位運算。定制小工具可以讓開發者高效地進行高度約束。 TurboPlonk 和UltraPlonk 定義了優雅的語法,以便開發者更輕鬆地使用查詢數據表和自定義小工具。這對於減少EVM 電路的成本非常有幫助。
遞歸證明的可行性越來越高。在過去遞歸證明依賴於特殊的循環橢圓曲線(即基於MNT 曲線的構造),需要大量的成本。目前更多的技術在不犧牲效率的前提下改變這種依賴情況。例如,Halo可以配對友好橢圓曲線,並使用特殊的內積參數來分攤遞歸成本。 Aztec 表明可以直接對現有協議進行聚合證明(查詢數據表可以減少非本地字段操作的成本,從而降低驗證電路的成本)。這種方法可以極大地提高電路負載量的可擴展性。
硬件加速更加高效。我們製造了GPU 和ASIC/FPGA 加速器,並且關於ASIC 證明者的論文已經被最大的計算機會議(ISCA)接受。 GPU 證明器比Filecoin 的實現快大約5 到10 倍。這將大幅提高證明器的計算效率。
zkEVM 是如何工作的,如何建造它呢?
除了強大的直覺和技術改進之外,我們還需要更清楚地知道我們需要證明什麼,並製定出更具體的架構。我們將在後續文章中介紹更多技術細節和比較。在這裡,我們描述了總體工作流程和一些關鍵思想。
開發人員和用戶的工作流程
開發人員可以使用任何與EVM 兼容的語言來運行智能合約,並將編譯後的字節碼部署在Scroll 上。然後,用戶可以發送交易與智能合約進行交互。用戶和開發者的體驗將與Layer 1 完全相同。但是,gas 費用顯著降低,並且在Scroll 上的交易訂單即時預先確認(提款只需幾分鐘即可完成)。
zkEVM 的工作流程
即使Layer 1 和Layer 2 表面上的工作流程沒有太多差別,但二者的底層處理過程完全不同:Layer 1 依賴於智能合約的重新執行;Layer 2 依賴於zkEVM 電路的有效性證明。
讓我們更詳細地解釋Layer 1 和Layer 2 交易的情況有何不同。
在Layer 1 ,智能合約的字節碼存儲在以太坊存儲中,交易將在P2P 網絡中廣播。對於每個事務,每個全節點都需要加載相應的字節碼並在EVM 上執行以達到相同的狀態(事務將作為輸入數據)。
Layer 2 的智能合約字節碼也以相同的方式進行操作,但後續步驟是交易將在鏈下發送到一個集中的zkEVM 節點。然後,zkEVM 執行字節碼並生成一個簡潔的證明,以證明在應用交易後狀態已正確更新。最後,Layer 1 合約將驗證證明並更新狀態,而無需重新執行交易。
讓我們深入了解一下執行過程,看看zkEVM 最終需要證明什麼。在原生執行中,EVM 首先加載字節碼,然後從頭開始逐個執行字節碼中的操作碼,對每個操作碼執行以下三個子步驟:
(i)從堆棧、內存或存儲中讀取元素
(ii)對這些元素執行一些計算
(iii)將結果寫回堆棧、內存或存儲。[5]例如,add操作碼需要從堆棧中讀取兩個元素,將它們相加並將結果寫回堆棧。
所以zkEVM 的證明需要包含與執行過程相對應的以下幾個方面:
-
字節碼從存儲中正確加載(以便虛擬機正確地運行從給定地址加載的操作碼)
-
字節碼中的操作碼逐個執行(字節碼按順序執行,不會丟失或跳過任何操作碼)
-
每個操作碼都正確執行(每個操作碼中的三個子步驟都正確執行讀寫和計算)
zkEVM 設計亮點
在設計zkEVM 的架構時,我們需要處理/解決上述三個問題。
第一,為密碼驗證器設計一個電路。這部分就像一個“可驗證的存儲”,我們通過使用密碼驗證器這種技術手段來保證驗證結果的正確性。[6] 以默克爾樹為例,部署的字節碼將作為葉節點存儲在Merkle 樹中。然後驗證者可以使用簡潔的證明來驗證從給定地址加載的字節碼(即驗證電路中的默克爾路徑)。對於以太坊存儲,則需要電路兼容Merkle Patricia Trie 和Keccak 哈希函數。
第二,設計一個電路來將字節碼與真實的執行產生關聯。將字節碼轉移到靜態電路中會帶來一個問題:像jump 這樣的條件式操作碼(與智能合約中的loop、if else 語句相對應)可能會跳轉到任何地方。在某個人使用特定輸入運行該字節碼之前,跳轉目的地都是不確定的。這就是為什麼我們需要驗證實際的執行踪跡。執行踪跡可以被認為是“展開的字節碼”,包含按實際執行順序排列的操作碼(即,如果你跳轉到另一個位置,踪跡中將包含該目標操作碼和位置)。
證明者將直接提供執行踪跡作為電路的見證數據。我們需要證明該執行追踪是通過特定字節碼使用特定的輸入“展開” 的工作,目的是強制讓程序計數器的值保持一致。針對目的地不確定的問題,解決思路是讓證明者提供一切數據。然後通過查找參數高效地檢查一致性(即,證明帶有準確全局計數器的操作碼包含在“總線” 中)。
第三,為每個操作碼設計電路(證明每個操作碼中的讀寫和計算都是正確的)。這是最重要的部分,證明執行跟踪中的每個操作碼都是正確且一致的。如果將所有東西直接放在一起,將會帶來高昂的成本。這裡的優化方案是:
1)我們將讀寫和計算分成兩個證明。一個證明會將所有操作碼用到的元素都放到“總線” 中,另一個證明會證明對“總線” 上元素的計算是正確執行的。這會大幅降低每個部分的成本(生成計算證明時無需考慮整個EVM 存儲)。前者被稱為“狀態證明”,後者被稱為“EVM 證明”。另一個發現是,查找聲明可以有效處理“總線映射” 。
2)我們可以為每個操作碼設計度數更高的定制化約束(即,我們可以將一個EVM word 切分成多個數據塊,以便更高效地處理)。我們可以選擇是否根據需求通過一個選擇符多項式來“打開” 一個約束。這樣可以避免每個操作都要消耗整個EVM 電路的成本。
這個架構最初由以太坊基金會提出,依然處於早期階段,正在積極開發中。我們正在與以太坊基金會進行密切合作,旨在找到最佳方式實現該EVM 電路。迄今為止,我們已經定義了EVM 電路最重要的特點,並(使用Halo2 庫中的UltraPlonk 語法)實現了一些操作碼。更詳細的內容將在後續文章中介紹。我們推薦感興趣的讀者閱讀這篇文檔。開發流程將是透明化的。這將是集整個社區之力的完全開源的設計。希望會有更多人加入進來,貢獻出一份力量。
zkEVM 還能帶來什麼?
zkEVM 遠不僅僅是Layer 2 擴容。我們可以將它理解為通過Layer 1 有效性證明擴展以太坊Layer 1 的直接方式。這意味著不需要任何特殊的Layer 2 就可以擴展現有的Layer 1。
例如開發者可以將zkEVM 當作全節點來使用,該證明可以用來直接證明現有狀態之間的轉換。所有Layer 1 交易無需將任何東西遷移到Layer 2 上,你可以直接證明!更寬泛地來說,你可以使用zkEVM 為整個以太坊生成簡潔證明,就像Mina 那樣。唯一需要增加的東西是證明遞歸(將區塊的驗證電路嵌入zkEVM)[7]。
結論
zkEVM 可以為開發者和用戶提供相同的體驗。在不犧牲安全性的情況下,它的價格要便宜幾個數量級。已經提出了以模塊化方式構建它的架構。它利用最近在零知識證明方面的突破來減少成本(包括自定義約束、查找參數、證明遞歸和硬件加速)。我們期待看到更多的人加入zkEVM 社區,與我們一起集思廣益!
備註:
[1]: Starkware 於2021 年9 月1 日的公告中聲明已實現可組合性。
[2]: 電路是固定且靜態的。例如,在將一個程序實現為電路時,你無法使用可變上限循環。上限必須固定為最大值。電路無法處理動態邏輯。
[3]: 為便於讀者理解,我們在這裡詳細說明EVM 電路的成本。正如前文所言,電路是固定且靜態的。因此,EVM 電路需要包含所有可能的邏輯(這個體量是僅包含add 的電路的10000 倍)。這就意味著,即使你只想證明add,你依然需要負擔該EVM 電路中可能包含的所有邏輯的成本。也就是說,成本被放大了10000 倍。在執行追踪中,你需要證明一連串操作碼,而且每個操作碼都會帶來高昂的成本。
[4]: EVM 本身並沒有與默克爾-帕特里夏樹(MPT)緊密綁定。目前,MPT 僅用於存儲以太坊狀態。要換一個很容易(有人提議使用Verkle 樹替換掉MPT)。
[5]: 這是經過高度簡化的抽象概念。從技術上來說,“EVM 狀態” 的名單更長,包括程序計數器、gas 餘量、調用棧(以上所有加上堆棧中每次調用的地址和靜態)、一組日誌和交易範圍變量(熱存儲槽、退款、自毀)。我們可以另外引入針對不同調用環境的標識符來直接支持可組合性。
[6]: 由於存儲量很大,我們使用累加器進行存儲。內存和堆棧可以使用可編輯的Plookup(我們可以通過這種方式有效地實現“RAM”)。
[7]: 將一個完整的遞歸證明添加進zkEVM 電路並非易事。實現遞歸的最好方式還是使用循環橢圓曲線(即,Pasta 曲線)。我們需要引入某種“包裝(wrapping)” 過程讓遞歸在以太坊Layer 1 上可驗證。
編譯:餅乾,鏈捕手