編者按:很多人抱怨說區塊鏈速度慢過蝸牛,但其實慢是有原因的,下面👇由 FISCO BCOS 首席架構師 張開翔 為你講解為什麼區塊這麼慢?具體慢在哪裡?能不能快一點?
該文章被收錄在PANews 最近策劃上線的專題:加密投資第一課中,更多加密市場最重要的事請點擊下圖進行專題閱讀學習。
點擊此處下載PANews App,隨時隨地閱讀更多區塊鏈即時快訊和深度好文。
作者:張開翔|FISCO BCOS 首席架構師
原文標題:區塊鏈的速度困境:“貴”在信任,“慢”得其所
舉個例子
數錢,比如數一個億(是不是好刺激~)
1、如果一個人數,慢,但好在專注,全力以赴,在可見的時間內可以數完。這叫單線程密集計算。
2、如果N個人一起數,每人平分,分頭同時數,最後匯總總數,所用時間基本上是第一種情況的1/N,參與的人越多,所需時間就越少,TPS就越高。這叫並行計算和MapReduce。
3、如果N個人一起數,但由於這N個人互相不信任,得彼此盯著,首先抽籤選一個人,這個人撿出一疊錢(比如一萬塊一疊)數一遍,打上封條,簽名蓋章,然後給另外幾個人一起同時重新數一遍,數好的人都簽名蓋章,這疊錢才算點好了。然後再抽籤換個人檢出下一疊來數,如此循環。因為一個人數錢時別人只是盯著,而且一個人數完且打上封條和簽名的一疊錢,其他人要重複數一遍再簽名確認,那麼可想而知,這種方式肯定是最慢的。這就叫區塊鏈。
但換個角度,方式1,一個人數有可能會數錯,這個人有可能生病或休假,導致沒有人幹活,更壞的結果是,這個人可能調換假幣或者私藏一部分錢,報一個錯的總數。
方式2,N個人中會有一定比例數錯,也可能其中一個人休假或者怠工,導致最終結果出不來,更可能因為人多手雜,出現部分人偷錢、換假錢、報假數……
方式3,很慢,但是很安全,因為所有人都會盯著全過程進行驗算,所以肯定不會數錯。如果其中有人掉線,可以換人撿出新的一疊錢繼續數,工作不會中斷。所有數過的錢上面都有封條和簽名,不會被做手腳,萬一出錯了也可以找到責任人進行追責。這種情況下,資金安全是完全得到保障的,除非所有的參與者都串通一氣了。該模式下,參與的人越多,資金安全性就越高。
所以,區塊鏈方案致力追求的是,在缺乏互相信任的分佈式網絡環境下,實現交易的安全性、公允性,達成數據的高度一致性,防篡改、防作惡、可追溯,付出的代價之一就是性能。
最著名的比特幣網絡,平均每秒只能處理5~7筆交易,10分鐘出1個塊,達到交易的最終確定性需要6個塊也就是1個小時,且出塊過程相當損耗算力(POW挖礦)。號稱“全球計算機”的以太坊,每秒能處理的交易數也僅是2位數的量級,十幾秒出1個塊。以太坊目前也是採用損耗算力的共識機制POW挖礦,會逐步遷移到POS共識機制。這兩個網絡在粉絲們爆炸性地進行交易時,可能會陷入擁堵狀態,大量的交易發出後,一兩天甚至更長的時間才會被打包確認。
但在資金安全就是命的場景下,有些事情是“必須”的,所以,即使慢,還是會考慮選擇區塊鏈。
區塊鍊為什麼慢
分佈式系統裡有一個著名的理論叫CAP理論:2000年,Eric Brewer教授提出一個猜想:一致性、可用性和分區容錯性三者,無法在分佈式系統中被同時滿足,並且最多只能滿足其中兩個。
CAP的大致解釋
Consistency(一致性) :數據一致更新,所有數據變動都是同步的
Availability(可用性):好的響應性能
Partition tolerance(分區容錯性): 可靠性
這個理論雖然有一些爭議,但從工程實踐中看,和光速理論一樣,可以無限逼近極致但是難以突破。區塊鏈系統能把一致性和可靠性做到極致,但是“好的響應性能”方面一直有點被人詬病。
我們面向的“聯盟鏈”領域,因為在准入標準,系統架構、參與節點數、共識機制等方面都和公鏈不同,其性能表現遠高於公有鏈,但是目前幾個主流的區塊鏈平台,在常規PC級服務器硬件上實測,TPS一般是在千級的樣子,交易延遲一般在1秒到10秒這個級別。 (聽說TPS十幾萬級和百萬級千萬級區塊鏈已經做出來了?好吧,期待)
筆者曾在大型互聯網公司工作多年,在海量服務領域,面對C10K問題(concurrent 10000 connection,萬級並發)已經有輕車熟路的解決方案,對一般的電商業務或內容瀏覽服務,普通pc級服務器單機達到幾萬TPS,且平均延時在500毫秒以內,飛一般的體驗已經是常態,畢竟互聯網產品卡一下說不定就會導致用戶流失。對於快速增長的互聯網項目,通過平行擴容、彈性擴容、立體擴容的方式,幾乎能無底線、無上限地面對山呼海嘯的海量流量。
相比而言,區塊鏈的性能比互聯網服務慢,而且難以擴容,根因還是在其“用計算換信任”的設計思路上。
具體哪裡慢呢?
從“古典”區塊鏈的系統內部來看
1、為了安全防篡改防洩密可追溯,引入了加密算法來處理交易數據,增加了CPU計算開銷,包括HASH、對稱加密、橢圓曲線或RSA等算法的非對稱加密、數據簽名和驗簽、CA證書校驗,甚至是目前還慢到令人髮指的同態加密、零知識證明等。在數據格式上,區塊鏈的數據結構本身包含了各種簽名、HASH等交易外的校驗性數據,數據打包解包、傳輸、校驗等處理起來較為繁瑣。
對比互聯網服務,也會有數據加密和協議打包解包的步驟,但是越精簡越好,優化到了極致,如無必要,絕不增加累贅的計算負擔。
2、為了保證交易事務性,交易是串行進行的,而且是徹底的串行,先對交易排序,然後用單線程執行智能合約,以避免亂序執行導致的事務混亂、數據衝突等。即使在一個服務器有多核的CPU,操作系統支持多線程多進程,以及網絡中有多個節點、多台服務器的前提下,所有交易也是有條不紊地、嚴格地按單線程在每台計算機上單核地進行運算,這個時候多核CPU其他的核可能完全是空閒的。
而互聯網服務則是能用多少服務器的多少個核,採用全異步處理、多進程、多線程、協程、緩存、優化IOWAIT等等,一定會把硬件計算能力跑滿。
3、為了保證網絡的整體可用性,區塊鏈採用了P2P網絡架構以及類似Gossip的傳輸模式,所有的區塊和交易數據,都會無差別地向網絡廣播,接收到的節點繼續接力傳播,這種模式可以使數據盡可能地傳達給網絡中的所有人,即使這些人在不同的區域或子網裡。代價是傳輸冗餘度高,會佔用較多的帶寬,且傳播的到達時間不確定,可能很快,也可能很慢(中轉次數很多)。
對比互聯網服務,除非出錯重傳,否則網絡傳輸一定是最精簡的,用有限的帶寬來承載海量的數據,且傳輸路徑會爭取最優,點對點傳輸。
4、為了支持智能合約特性,類似以太坊等區塊鏈解決方案,為了實現沙盒特性,保證運行環境的安全和屏蔽不一致性因素,其智能合約引擎要么是解釋型的EVM,或者是採用docker封裝的計算單元,智能合約核心引擎的啟動速度,指令執行速度,都沒有達到最高水平,消耗的內存資源也沒有達到最優。
而用常規計算機語言如C++、JAVA、go、rust語言直接實現海量互聯網服務,在這方面常常沒有限制。
5、為了達到可容易校驗防篡改的效果,除了第一條提到的,區塊數據結構裡攜帶數據較多之外,針對交易輸入和輸出,會採用類似merkle樹、帕特里夏(Patricia )樹等複雜的樹狀結構,通過層層計算得到數據證明,供後續流程快速校驗。樹的細節這裡不展開,可以通過網絡上的資料來學習其機制。
基本上,生成和維護這種樹的過程是非常非常非常非常繁瑣的,既佔用CPU的計算量,又佔用存儲量,使用了樹後,整體有效數據承載量(即客戶端發起的交易數據和實際存儲下來的最終數據對比)急劇下降到百分之幾,極端情況下,可能接受了10m的交易數據後,在區塊鏈磁盤上可能實際需要幾百兆的數據維護開銷),因為存儲量的幾何級數增加,對IO性能要求也會更高。
互聯網服務因為基本不考慮分佈式互驗互信的問題,很少有使用這種樹的證明結構,了不起算下MD5和HASH做為協議校驗位。
6、為了達到全網一致性和公信力,在區塊鏈中所有的區塊和交易數據,都會通過共識機制框架驅動,在網絡上廣播出去,由所有的節點運行多步複雜的驗算和表決,大多數節點認可的數據,才會落地確認。
在網絡上增加新的節點,並不會增加系統容量和提升處理速度,這一點徹底顛覆了“性能不足硬件補”的常規互聯網系統思維,其根因是區塊鏈中所有節點都在做重複的驗算以及生成自己的數據存儲,並不復用其他節點數據,且節點計算能力參差不齊,甚至會使最終確認的速度變慢。
在區塊鏈系統中增加節點,只會增加可容錯性和網絡的公信力,而不會增強性能表現,使得在同一個鏈中,平行擴展的可能性基本缺失了。
而互聯網服務大多是無狀態的,數據可緩存可複用,請求和返回之間的步驟相對簡單,容易進行平行擴展,可以快速調度更多的資源參與服務,擁有無限的彈性。
7、因為區塊數據結構和共識機制特性,導致交易到了區塊鏈之後,會先排序,然後加入到區塊裡,以區塊為單位,一小批一小批數據的進行共識確認,而不是收到一個交易立刻進行共識確認,比如:每個區塊包含1000個交易,每3秒共識確認一次,這個時候交易有可能需要1~3秒的時間才能被確認。
更壞的情況是,交易一直在排隊,而沒有被打包進區塊(因為隊列擁堵),導致確認時延更長。這種交易時延一般遠大於互聯網服務500ms響應的標準。所以區塊鏈其實並不適合直接用於追求快速響應的實時交易場景,行業通常說的“提高交易效率”是把最終清結算的時間都算在內的,比如把T+1長達一兩天的對賬或清計算時延,縮短到幾十秒或幾分鐘,成為一個“準實時”的體驗。
綜上所述,區塊鏈系統天生就背著幾座大山,包括單機內部計算開銷和存儲較大,背著串行計算的原罪,網絡結構複雜冗餘度高,區塊打包共識的節奏導致時延較長,而在可擴展性上又難以直接增加硬件來平行擴容,導致scale up和scale out兩方面,都存在明顯瓶頸。
Scale Out(等同scale horizontally):橫向擴展,向外擴展,如:向原有系統添加一組獨立的新機器,用更多的機器來增加服務容量
Scale Up(等同Scale vertically):縱向擴展,向上擴展,如向原有的機器添加CPU、內存,在機器內部增加處理能力
直面區塊鏈的速度困境,FISCO BCOS的開發者發揮“愚公移山”的精神,努力優化。經過一段時間的努力,已經移山倒海,修出了一條又一條高速通道,使區塊鏈找到了邁向極速時代的路子(詳見下篇),這就是我們系列文章要深入解析的內容。
編者溫馨提醒:本文內容僅供學習參考,不能作為投資建議。