EIP-4444 能夠解決以太坊歷史成長問題,並為Gas 上限增加留出空間。相關閱讀:《Paradigm:以太坊狀態成長的挑戰與解決方案》
撰文:Storm Slivkoff、Georgios Konstantopoulos
編譯:Luffy,Foresight News
歷史成長(History growth)是目前以太坊擴容的最大瓶頸。出乎意料的是,歷史成長已經成為比狀態成長更大的問題。幾年之內,歷史資料將超過許多以太坊節點的儲存容量。
好消息是:
- 歷史成長是一個比狀態成長更容易解決的問題。
- 解決方案已在積極開發中。
- 解決歷史成長將緩解狀態成長問題。
在這篇文章中,我們將繼續研究第1 部分的以太坊擴容問題,現在將注意力從狀態成長轉向歷史成長。使用精細的資料集,我們的目標是1) 從技術上理解以太坊的擴展瓶頸,以及2) 幫助圍繞以太坊Gas 限制的最優解展開討論。
什麼是歷史成長?
歷史是以太坊在其整個生命週期中執行的所有區塊和交易的集合,它是從創世區塊到當前區塊的所有數據。歷史成長是隨著時間的推移新區塊和新交易的累積。
圖1 顯示了歷史成長與各種協定指標和以太坊節點硬體約束之間的關係。與狀態成長相比,歷史成長受到一組不同的硬體約束限制。歷史成長給網路IO 帶來壓力,因為新的區塊和交易必須在整個網路中傳輸。歷史成長也會給節點的儲存空間帶來壓力,因為每個以太坊節點都會儲存完整的歷史記錄副本。如果歷史成長速度夠快以致於超出這些硬體限制,則節點將不再能夠與其對等節點達成穩定的共識。有關狀態增長和其他擴容瓶頸的概述,請參閱本系列文章的第1 部分。
圖1:以太坊擴容瓶頸
直到最近,每個節點的大部分網路吞吐量都用於傳輸歷史記錄(例如新區塊和交易)。隨著Dencun 硬分叉中引入blob,這種情況發生了變化。 blob 現在佔據了節點網路活動的很大一部分。但是,blob 不被視為歷史記錄的一部分,因為1) 它們只由節點儲存2 週,然後被丟棄,2) 它們不需要重複以太坊創世以來的資料。由於(1),blob 不會顯著增加每個以太坊節點的儲存負擔。我們將在本文的後面部分討論blob。
在本文中,我們將重點討論歷史成長,並討論歷史與狀態之間的關係。由於狀態增長和歷史增長具有一些重疊的硬體約束,因此它們是相關的問題,解決一個問題可以幫助解決另一個問題。
歷史成長有多快?
圖2 顯示了自以太坊創世以來的歷史成長率。每條垂直線代表一個月的成長。 y 軸表示該月歷史成長的千兆位元組數。交易依其「目標位址」分類,並使用RLP(https://ethereum.org/en/developers/docs/data-structures-and-encoding/rlp/)位元組表示大小。無法輕易辨識的合約被歸類為「未知」。 「其他」類別包括基礎設施和遊戲等一系列小類別。
圖2:以太坊歷史成長率隨時間變化
上述圖表中的幾個關鍵要點:
- 歷史成長速度比狀態成長快6 到8 倍:歷史成長速度最近達到高峰36.0 GiB/ 月,目前為19.3 GiB/ 月。狀態成長速度高峰約6.0 GiB/ 月,目前為2.5 GiB/ 月。本文後面將介紹歷史與狀態在成長和累積大小的比較。
- 在Decun 之前,歷史成長率一直在加速:雖然狀態多年來一直呈現大致線性成長(參見第1 部分),但歷史卻呈現超線性成長。考慮到線性成長的成長率會導致整體規模呈現二次方成長,因此超線性成長的成長率會導致整體規模超過二次方成長。這種加速在Dencun 之後突然停止。這是以太坊首次經歷歷史成長率的大幅下降。
- 近期歷史成長的大部分來自Rollup:每個L2 都會將其交易副本發布回主網。這產生了大量歷史記錄,並導致Rollup 成為過去一年歷史成長的最重要貢獻者。然而,Dencun 允許L2 使用blob 而不是歷史記錄發布其交易數據,因此Rollup 不再產生大部分以太坊歷史記錄。我們將在本文後面更詳細介紹Rollup。
以太坊歷史成長最大的貢獻者是誰?
不同合約類別產生的歷史數量揭示了以太坊的使用模式如何隨著時間的推移而演變。圖3 顯示了各種合約類別的相對貢獻。這是與圖2 相同的數據進行了標準化。
圖3:不同合約類別對歷史成長的貢獻
這些數據揭示了以太坊使用模式的四個不同時期:
- 早期(紫色):以太坊的最初幾年幾乎沒有鏈上活動。在這些早期合約中,大多數現在都很難識別,在圖表中標記為“未知”。
- ERC-20 時代(綠色): ERC-20 標準於2015 年底最終確定,但直到2017 年和2018 年才獲得顯著發展。 ERC-20 合約在2019 年成為最大的歷史成長來源。
- DEX / DeFi 時代(棕色): DEX 和DeFi 合約早在2016 年就已出現在鏈上,並於2017 年開始受到關注。但直到2020 年DeFi 夏季,它們才成為歷史成長的最大類別。 DeFi 和DEX 合約在2021 年和2022 年的部分時間佔據了歷史成長的50% 以上。
- Rollup 時代(灰色): 2023 年初,L2 Rollup 開始執行比主機更多的交易。在Dencun 之前的幾個月裡,它們產生了大約2/3 的以太坊歷史記錄。
每個時代都代表著比之前更複雜的以太坊使用模式。隨著時間的推移,複雜性可以看作是以太坊擴展的一種形式,它無法透過每秒交易量等簡單指標來衡量。
在最近的資料月份(2024 年4 月)中,Rollup 不再產生大部分歷史記錄。目前尚不清楚未來的歷史記錄是否源自DEX 和DeFi,或者是否會出現一些新的使用模式。
那blob 又如何呢?
Dencun 硬分叉引入了blob,顯著改變了歷史成長動態,它允許Rollup 使用廉價的blob 而不是歷史記錄來發布數據。圖4 放大了Dencun 升級前後的歷史成長率。這張圖表與圖2 類似,只是每條垂直線代表一天而不是一個月。
圖4:Dencun 對歷史成長的影響
從該圖表中我們可以得出幾個關鍵結論:
- 自Dencun 以來,rollup 的歷史成長下降了約2/3:大多數rollup 已從call data 轉換為blob,這大大減少了它們產生的歷史記錄量。但是,截至2024 年4 月,仍有一些rollup 尚未從call data 轉換為blob。
- 自Dencun 以來,總歷史成長下降了約1/3: Dencun 僅降低了rollup 的歷史成長。其他合約類別的歷史成長略有增加。即使在Dencun 之後,歷史成長仍然是狀態成長的8 倍(詳情請參閱下一節)。
儘管blob 已經降低了歷史成長速度,但它們仍然是以太坊的新功能。目前尚不清楚在blob 存在的情況下,歷史成長速度會穩定在什麼水平。
多快的歷史成長是可接受的?
提高Gas 上限將增加歷史成長率。因此,提高Gas 上限的提案(例如Pump the Gas)必須考慮歷史成長與每個節點硬體瓶頸之間的關係。
要確定可接受的歷史成長率,首先要了解目前節點硬體在網路和儲存方面能夠維持多久。聯網硬體可能可以無限期地維持現狀,因為在增加Gas 限制之前,歷史成長率不太可能回到Dencun 之前的高峰。然而,歷史的儲存負擔會隨著時間的推移而不斷增加。在目前的儲存策略下,每個節點的儲存硬碟最終都會被歷史記錄填滿,這是不可避免的。
圖5 顯示了以太坊節點隨時間變化的儲存負擔,並預測了未來3 年儲存負擔的成長。預測參照2024 年4 月的成長率。隨著未來使用模式或Gas 限制的變化,該成長率可能會上升或下降。
圖5:歷史記錄、狀態和全節點儲存負擔的大小
從該圖中我們可以得出幾個關鍵結論:
- 歷史記錄佔用的儲存空間大約是狀態的3 倍。這種差異也會隨著時間的推移而增加,因為歷史成長速度大約是狀態的8 倍。
- 1.8 TiB 是臨界閾值,許多節點將被迫升級其儲存硬碟。 2TB 是常見的儲存硬碟大小,僅提供1.8TiB 的可用空間。請注意,TB(1 兆位元組)與TiB(= 1024 ^ 4 位元組)是不同的單位。對於許多節點運營商來說,「真正的」臨界閾值甚至更低,因為合併後驗證器必須與執行客戶端一起運行共識客戶端。
- 臨界閾值將在2 到3 年內達到。提高任何數量的Gas 限制都會相應加快這一時間的到來。達到此閾值將給節點運營商帶來不小的維護負擔,並需要購買額外的硬體(例如300 美元的NVME 驅動器)。
與狀態資料不同,歷史資料是僅附加的,存取頻率要低得多。因此,理論上可以將歷史資料與狀態資料分開儲存在更便宜的儲存媒體上。這可以透過Geth 等一些客戶端來實現。
除了儲存容量之外,網路IO 是歷史成長的另一個主要限制。與儲存容量不同,網路IO 限制不會在短期內為節點帶來問題,但這些限制對於未來增加Gas 限制將變得非常重要。
要了解典型以太坊節點的網路容量可以支持多少歷史成長,必須知道歷史成長與各種網路健康指標之間的關係,例如重組率、時隙未命中、最終未命中、證明未命中、同步委員會未命中和區塊提交延遲。這些指標的分析超出了本文的範圍,但可以在先前對共識層健康狀況的調查中找到更多資訊。此外,以太坊基金會的Xatu 計畫一直在建立公共數據集,以加快此類分析。
如何解決歷史成長問題?
歷史成長是一個比狀態成長更容易解決的問題。它幾乎可以完全由候選提案EIP-4444 解決。這項EIP 將每個節點從保存整個以太坊歷史資料更改為僅保存一年的歷史資料。實施EIP-4444 後,資料儲存將不再是以太坊擴容的瓶頸,長遠來看Gas 限制增加也不在被約束。 EIP -4444 對於網路的長期可持續性是必要的,否則歷史成長速度會很快,需要定期更新網路節點的硬體。
圖6 顯示了EIP-4444 在未來3 年內對每個節點的儲存負擔的影響。這與圖4 相同,但增加了較淺的線條,表示EIP-4444 實施後的儲存負擔。
圖6:EIP-4444 對以太坊節點儲存負擔的影響
從這張圖中可以看出一些關鍵結論:
- EIP-4444 將使目前的儲存負擔減半。儲存負擔將從1.2 TiB 降至633 GiB。
- EIP-4444 將穩定歷史儲存負擔。假設歷史成長率恆定,則歷史數據將以產生的速率丟棄。
- 在EIP-4444 之後,節點儲存負擔需要很多年才能達到今天的水平。這是因為狀態成長將是增加儲存負擔的唯一因素,而狀態的成長速度比歷史成長慢。
在實施EIP-4444 後,歷史成長仍將帶來一定程度的儲存負擔,因為節點將儲存一年的歷史記錄。但是,即使以太坊達到全球規模,這個負擔也不難解決。一旦歷史記錄保存方法被證明是可靠的,EIP-4444 的一年到期時間可能會縮短到幾個月、幾週甚至更短。
如何保存以太坊的歷史記錄?
EIP-4444 提出了一個問題:如果歷史記錄不是由以太坊節點自己保存,那麼它應該如何保存?歷史記錄在以太坊的驗證、會計和分析中起著核心作用,因此保存歷史記錄至關重要。幸運的是,歷史記錄保存是一個簡單的問題,只需要1/n 誠實的資料提供者。這與需要1/3 到2/3 的參與者誠實的狀態共識問題形成鮮明對比。節點操作員可以透過1) 重播創世區塊以來的所有交易和2) 檢查這些交易是否重現與當前區塊鏈端具有相同的狀態根來驗證歷史資料集的真實性。
保存歷史記錄的方法有很多種。
- Torrents/P2P: Torrents 是最簡單、最可靠的方法。以太坊節點可以定期打包部分歷史記錄並作為公共Torrent 檔案共用。例如,一個節點可能每100,000 個區塊創建一個新的歷史Torrent 檔案。像erigon 這樣的節點客戶端已經在某種程度上以非標準化的方式執行了此過程。為了標準化此流程,所有節點客戶端都必須使用相同的資料格式、相同的參數和相同的P2P 網路。節點將能夠根據其儲存和頻寬能力選擇是否參與此網路。 Torrents 的優勢在於使用已經得到大量資料工具支援的高lindy 開放標準。
- Portal Network:Portal Network 是專為託管以太坊資料而設計的新網路。這是一種類似Torrent 的方法,同時也提供了一些額外的功能,讓資料驗證更加容易。 Portal Network 的優勢在於,這些額外的驗證層為輕客戶端提供了實用程序,可以有效地驗證和查詢共用資料集。
- 雲端主機: AWS 的S3 或Cloudflare 的R2 等雲端儲存服務為保存歷史記錄提供了一個便宜且高效能的選擇。然而,這種方法帶來了更多的法律風險和業務營運風險,因為不能保證這些雲端服務始終願意並且能夠託管加密貨幣資料。
其餘的實施挑戰更多是社會挑戰而非技術挑戰。以太坊社群需要協調具體的實施細節,以便將它們直接整合到每個節點用戶端中。特別是,從創世區塊開始執行完全同步(而不是快照同步)將需要從歷史記錄提供者而不是以太坊節點檢索歷史記錄。這些變更在技術上不需要硬分叉,因此它們可以比以太坊的下一個硬分叉Pectra 更早實現。
所有這些歷史保存方法也可以由L2 用來保存他們發佈到主網的blob 資料。與歷史保存相比,blob 保存1) 更困難,因為總資料量大得多;2) 較不重要,因為blob 對於重播主網歷史不是必需的。但是,對於每個L2 重播自己的歷史來說,blob 保存仍然是必要的。因此,某種形式的blob 保存對整個以太坊生態系統都很重要。此外,如果L2 開發出強大的blob 儲存基礎設施,它們也可能能夠輕鬆儲存L1 歷史資料。
直接比較EIP-4444 之前和之後各種節點配置儲存的資料集會很有幫助。圖7 顯示了不同以太坊節點類型的儲存負擔。狀態資料是帳戶和合約,歷史資料是區塊和交易,存檔資料是一組可選資料索引。此表中的位元組數是基於最近的reth 快照,但其他節點客戶端的數字應該大致相當。
圖7:不同以太坊節點類型的儲存負擔
換句話說,
- 存檔節點儲存狀態資料和歷史資料以及存檔資料。當有人希望能夠輕鬆查詢歷史鏈狀態時,可以使用存檔節點。
- 全節點僅儲存歷史資料和狀態資料。當今大多數節點都是全節點。全節點的儲存負擔大約是存檔節點的一半。
- EIP-4444 之後的全節點僅儲存狀態資料和最近一年的歷史資料。這將節點的儲存負擔從1.2 TiB 減少到633 GiB,並使歷史資料的儲存空間達到穩定狀態值。
- 無狀態節點,又稱「輕節點」,不儲存任何資料集,能夠立即在鏈的末端進行驗證。一旦Verkle 嘗試或其他狀態承諾方案新增到以太坊,這種節點類型就成為可能。
最後,還有一些額外的EIP 可以限制歷史成長率,而不僅僅是適應當前成長率。這在短期內有助於保持在網路IO 約束內,在長期內有助於保持在儲存約束之內。儘管EIP-4444 對於網路的長期可持續性仍然是必要的,但這些其他EIP 將有助於以太坊在未來更有效地擴展:
- EIP-7623:重新定價call data,使某些call data 過多的交易更加昂貴。使這些使用模式更加昂貴將迫使其中一些從call data 轉換為blob。這將降低歷史成長率。
- EIP-4488:對每個區塊中可包含的call data 總量施加限制。這將對歷史記錄的成長速度施加更嚴格的限制。
這些EIP 比EIP-4444 更容易實現,因此它們可能作為EIP-4444 投入生產之前的短期權宜之計。
結束語
本文的目的是透過數據來理解1) 歷史成長的工作原理和2) 解決該問題的方法。本文中的許多數據難以透過傳統的方式獲取,因此我們希望公開這些數據為歷史成長問題提供一些新見解。
歷史成長作為以太坊擴容的瓶頸尚未得到足夠的重視。即使不增加Gas 上限,以太坊目前保存歷史記錄的慣例也會迫使許多節點在幾年內升級硬體。幸運的是,這不是一個難以解決的問題。 EIP-4444 中已經有一個明確的解決方案。我們認為應該加快實施此EIP,以便為未來的Gas 上限增加留出空間。