2月11日,存儲網絡Arweave 宣布2.6版本已經開發完成,創始人Sam Williams表示將會在3月6日激活網絡硬分叉。
本次更新將會集中在兩個方面,一是降低Arweave存儲數據的能源消耗,以提高存儲市場的效率;二是激勵礦工存儲更多數據,尤其是稀有數據備份和音視頻等重度空間需求的數據類型。
具體而言,主要會包括以下四個具體措施:
- 通過鼓勵礦工使用更便宜的硬盤來存儲數據,而不是繼續提升傳輸速度,從而降低AR存儲的平均成本;
- 通過激勵礦工備份更多Arweave主網數據的完整副本,從而建立更快地索引信息,以實現更“分佈式”的數據備份網絡;
- 允許將更多的挖礦算力投放至真正有用的數據類型來減少網絡中的能源浪費,避免過度的垃圾信息換取AR代幣;
- 允許在Arweave網絡中以動態價格對存儲成本進行估算,從而引導礦工轉向更高價值的數據類型存儲上,提高網絡容錯率。
量大從優:空間擴容的第一性原理
在Arweave 2.6之前,礦工主要是通過競爭更快的提交驗證速度來競爭AR代幣,但是在Arweave 2.6更新中,將會引入哈希速度限制,礦工在單位時間內可以合併的交易量將會下降。
從而會將Arweave從計算密集型轉向資源密集型機制,更多的硬盤將帶來更多的AR激勵,從而引導網絡上的Gas Fee消耗轉向存儲更多的完整數據集。
在數據集的完整性上,將會繼續沿用SPoRA(隨機訪問的簡介證明)機制,從而鼓勵礦工存儲更多Arweave主網的完整數據集,而非通過存儲單個數據集的多個副本來作弊。
SPoRA的特點在於會通過對礦工提交的驗證結果進行歷史性回溯,主網會隨機對新提交的區塊進行隨機檢查,以確認是否存在舊的區塊信息,在確認存在後,新的區塊才能被納入主網之中,礦工進而得到AR獎勵。
通過對整個網絡的區塊確認機制的修改,Arweave將會成為空間性最優的新存儲網絡,以實現減少單位能源消耗的同時,提升整個Arweave網絡的數據完整性和存儲容量。
新式“編織”:挖礦機制將導向增強冗餘
Arweave 2.6意在改變單純的礦工提交速度,這是出於存儲和公鏈不同的特性而採取的優化措施,比特幣等公鏈競爭的是提交速度,以維護網絡的正常結算能力和保證主網確認結果的唯一性,但是存儲在考慮確認速度的同時,還需要考慮數據的完整性,以防止單一節點作弊導致數據丟失。
為此,Arweave 2.6會改變自己的數據組織方式,具體而言,會添加一個新的數據分區(Partitions),以適應新的挖礦機制。
Arweave中Weave(塊)為最小單一單位,均勻地分佈在Arweave網絡之上,負責標識存儲數據的位置,可以類比為“磚頭”;而緊隨其後的是chunk(組塊),通常是連續的塊數據,長度為固定的256KB,礦工所競爭的就是針對組塊的SPoRA提交證明,可以理解為一面牆。
而本次Arweave 2.6更新後會新加Partitions(分區),會以3.6TB的方式組織一個分區的規模,可以理解為一個房間的雛形,以提高數據利用的規模效應。
在更改後的挖礦競爭模型中,為了避免礦工通過存儲部分數據集的多個副本來佔據空間,每個數據的副本對於每個礦工而言都是唯一的地址,以更好辨識副本位置,並且減少無關數據的存儲,從而將空間分配給真正需要的數據。
對於礦工而言,存儲完整數據集的多個副本更容易得到主網承認,從而減少存儲部分數據的多份副本對主網容量的消耗。
固態VS機械:抹除硬盤速度優越性
在設計Arweave之初就考慮到對NFT等大型文件的存儲,尤其是在和Meta達成合作後,Arweave將承擔Instagram上NFT的永久存儲職責,而更多音、視頻等數據的湧入,將會導致整個網絡的負載和備份能力。
在Arweave 2.6之前的版本中,主要採用的是價格非常昂貴的SSD(固態硬盤),礦工為增加提交成功率,會刻意減少打包此類內容,進而節省寶貴的硬盤空間容量。
在Arweave 2.6中,主網上的合併數據塊是連續的內存塊,因此可以提升HDD(機械硬盤)的讀取性能,基本可以做到SSD(固態硬盤)相同的讀取速度,但得益於遠低於SSD的價格,礦工可以更大規模組建HDD陣列。
並且,為了避免“大力出奇蹟”的局面,Arweave 2.6中會盡可能平衡挖礦機制,以避免礦工通過增加SSD來超越使用HDD組網的收入水平。
部分礦工仍然可以選擇SSD來小幅領先同行,但是結合新的單一、稀有數據存儲激勵措施,存儲空間的浪費也會導致礦工的損失。
只要當SSD(固態硬盤)組網的收入無法覆蓋購買SSD的花費,那麼礦工轉向HDD就會成為最優解,而網絡中的SSD存量也會起到保障網絡速度的效果。
更新模型:動態定價確保數據完整
Arweave的目標是“一次存儲,永久保存”,用戶無需為保證數據完整性而續費,只需要在存儲數據時一次性付費,隨後Arweave會通過緩慢的釋放機制分發AR,來獎勵礦工為保存數據而進行的工作。
這裡面的關鍵在於,存儲價格需要綜合考慮用戶的承受能力,礦工的積極性,以及網絡的可持續性。
在Arweave 2.5中,引入了基於難度的動態定價機制,試圖在硬盤價格、存儲容量和故障率之間求取艱難的平衡,但是難以計算礦工使用的硬盤速度,因為競爭機制下只能估計主網的平均速度,而很難去評估單個礦工的硬件型號。
而在Arweave 2.6版本中,協議將會規定最高硬盤驅動速度,從而讓硬盤價格的計算有章可循,在這種機制下,礦工使用超越規定速度的硬槃無法獲得額外獎勵,因此為動態定價機制確定了一個堅實的基礎。
根據測算,Arweave主網至少可保障200年的存儲失效,而按照目前的硬盤平均故障時間間隔(MTBF),每份數據至少需要15個副本,更具長期保存能力的HDD也有利於數據的“永久化”存儲。
結語
本次Arweave更新,用創始人Sam Williams的話來說是“自2.4版本發布的SPoRA(簡潔證明機制)發布以來的最重要更新。”從更新內容中可以發現,Arweave在重新回歸存儲的初心,即如何永久化的存儲更多不同數據。