作者:0x解碼
產業發展14 年,從最初的炒作逐漸轉為實際應用。區塊鏈資料分析可以從鏈上宏觀、專案協議、地址三個層面進行。鏈上宏觀可以比較不同鏈的指標。專案協議需要深入理解業務邏輯。地址分析可以進行多維度的標籤標註。未來值得關注的幾個方向是比特幣Layer 2 擴容方案、以太坊質押資料和帳戶抽像多簽地址。整體來說,區塊鏈數據市場發展空間巨大。
簡介
如果把Bitcoin 的正式部署作為行業誕生的元年,隨著區塊鏈行業長達14 年的發展歷程,從最初單純的炒作和投機買賣,逐漸演變為具有實際應用場景的技術理念,特別是Decentralized finance (DeFi) 理念被用戶所認可和接受之後,使得價值回歸到鏈上,鏈上的數據因此也逐漸成為投資者和開發者關注的焦點。
《泰晤士報》2009 年1 月3 日的頭版文章標題– 財政大臣站在第二輪救助銀行的邊緣
儘管與目前互聯網中的大數據體量相比,區塊鏈的數據規模還比較有限,從原始數據上看也較為單一,但是在實際分析和解讀過程中,由於數據輸入端相對自由且包含大量不易理解的字節碼,許多分析師和開發者往往需要花費大量時間去解析和使用。從工作經驗來看,筆者認為可以從業務層面對區塊鏈資料進行分類,以便更好地理解:
-
鏈上宏觀
-
專案協議
-
地址分析
區塊鏈網路從宏觀到微觀可以分為三個層面,網路層面由多個協定組成,每個協定又由多個位址的活動組成。目前針對消費者的區塊鏈資料分析產品,大多深耕在這三個層面的某一具體場景。接下來筆者將就每個層面所對應的業務邏輯和應用形態進行闡述。
鏈上宏觀
從網路層級來看,可以再細分為:
-
Bitcoin (UTXO 模型)
-
Ethereum 為主的Ethereum Virtual Machine (EVM)
-
其他非EVM 架構的公有鏈(例如以Rust 語言開發的Solana、模組化公鏈Cosmos 生態、繼承Libra 的Move 語言體係等)。
通常作為對比,我們可以考察用戶數、交易數、交易價值和交易費用這四個指標,並在此基礎上進行二次分析,舉幾個簡單的例子:
-
根據部署合約的使用者數量和交易數,評估開發者在該網路上的活躍程度;
-
透過交易的時間間隔計算出每秒交易數(TPS),以判斷網路處理交易的效能;
-
計算交易金額和交易數的比值,得到平均每筆交易的金額,過多低價值交易其實是對網路的負擔;
-
觀察一段時間內的交易費用總額,評估網路的火熱程度,與交易數不同,交易費用的低谷代表用戶交易的急迫性較低。
資料來源:Dune
對資料使用者來說,網路層面的資料可以在眾多公鏈中進行選擇時提供輔助,根據自身情況選擇更合適的公鏈進行開發或使用,並抓住最佳時機參與其中。
專案協議
專案協議的分類非常廣泛,包含DeFi、Game、Non-Fungible Token (NFT)、Decentralized Identity (DID) 等等,新的類別也不斷出現,所以在這裡不具體展開某一類,而是談談分析專案協議資料過程中的幾點經驗:
-
通常一個完整的協議會由多個業務合約組成,大部分需要深入閱讀文檔(文檔清晰並及時更新很重要)並且結合自己的使用才能更好地理解項目。
-
同一領域的產品業務邏輯會趨同,例如所有DEX 的業務核心都是交易和流動性,理解頭部產品後再解析整個領域的其他項目會相對容易。或從專案方自行考慮,他們對自己的數據比較熟悉,但總希望了解更多競爭對手和產業現狀,這時垂直領域的數據就很有價值。
-
目前大多項目包含許多鏈下數據,如團隊和融資資訊、社群媒體數據、用戶網站操作數據、內部訂單資訊等,有的是公開的,有的是非公開的,這在分析項目時會有限制。但隨著產業發展,更多業務數據會逐步上鏈,因為用戶使用區塊鏈的目的之一就是更加公開透明。
資料來源:Dune
一個典型例子是在DeFi Summer 中,SushiSwap 向UniSwap 發起挑戰,兩者的鏈上交易額和交易數曾經相近,但深入分析可以發現,UniSwap 的獨立用戶數遠高於SushiSwap,即SushiSwap 的大部分交易和流動性來自較少的用戶,這裡的原因是Sushi Token 的發行機制刺激了資金流入,但後續因為經濟模型無法持續,資金又回流到了Uniswap。類似情況目前也反映在OpenSea 和Blur 的數據上,前者散戶交易居多,後者專業用戶交易居多。 (注意!這裡沒有對項目進行價值判斷,而是說明從數據中可以反映出用戶行為差異。)
資料來源:Dune
地址分析
從較為流行的EVM 架構公鏈來看,目前位址分為兩種類型,Externally Owned Accounts (EOA) 和Contact Account (CA)。針對地址的資料產品現有的業務形態,筆者認為主要有:
-
資產看板(多用於錢包展示資產狀況)
-
交易記錄(多用於顯示徽章和獎勵證明,如空投或DID)
-
標籤系統(多維度標籤進行推薦或風控)
資料來源:DeBank
這裡主要談談標籤這個維度。目前在消費端資料產品中標籤非常關鍵,例如對使用者來說,0xd8dA6BF26964aF9D7eEd9e03E53415D37aA96045 一看無法理解其意義,但顯示為vitalik.eth (Ethereum 創辦人) 則可以立即識別創辦人。當然這只是眾多標籤維度中的一個。筆者歸納了地址標籤的幾個維度:
-
實體標籤(表示何人)
-
行為標籤(做過什麼)
-
狀態標籤(目前或過去狀態)
-
預測標籤(未來可能做什麼)
-
其他標籤(使用者定義及難分類標籤)
資料來源:OKLink
目前多數數據產品只是簡單展示實體標籤,然後透過行為和狀態標籤顯示資金流向,深度挖掘還不夠,例如交易發起時顯示對手方地址年齡、資產和交易對象數,提示用戶注意風險;或者根據用戶過往交易行為建議類似的項目,例如參與多個NFT 的鑄造的地址可以向其推薦今天最多地址正在鑄造什麼NFT,這樣可以節省用戶搜尋時間。豐富的數據支援能為產品提供更強大的演算法服務。
個人觀點
最後,筆者想談談未來1-2 年內,在商業數據方面個人比較關注的三個方向:
-
Bitcoin Layer 2 (包括其他擴容方案產生的數據)
-
Ethereum Staking (Beacon Chain 數據)
-
Account Abstraction (基於ERC-4337 提案的帳戶抽象化和多簽地址資料)
比特幣二層(Bitcoin Layer 2)
對於Ordinals 這種為Bitcoin 網路最小單位「sat」編配編號的方案, Bitcoin 社群觀點不一,但其火熱為Bitcoin 生態增加了想像空間和礦工收入(交易費用)。從區塊空間和交易數量來看,Ordinals一度使交易費超過了區塊收入,但Bitcoin 網路顯然無法承載更多用戶完成資產交易。即使Bitcoin 的點對點支付故事已被數位黃金共識所取代,隨著區塊獎勵減半, Bitcoin 網路算力將面臨巨大挑戰。收入減少且競爭加劇必然會淘汰部分算力。當區塊獎勵幾乎可以忽略時,交易費將成為礦工的主要收入來源。如果網路交易量和費用沒有穩定成長,投射到現實就是礦工收入不穩,這會影響網路的多樣性和穩健性。在這種情況下,未來的可信賴擴容就顯得尤為重要,目前得到社群比較多共識認可的是Lightning Network 閃電網路的方案。
以太坊質押(Ethereum Staking)
作為整個Ethereum 生態最底層的價值存儲,Beacon Chain 的數據可謂是承載了最多資金的數據業務之一,但由於共識層和執行層結構不同,現有數據平台尚未很好呈現兩者的資金流動關係,目前Ethereum 的質押率在20% 左右,這在POS 共識機制中是一個相對較低的比率,特別是自從上海昇級開放質押提款之後,質押的淨流入量是在緩步提升的,所以筆者認為這部分的市場可望長期吸收沉澱資金,且發展空間龐大。
資料來源:beaconcha.in
帳戶抽象(Account Abstraction)
在目前資料分析視角下,大多數專案協議只把EOA 位址作為使用者帳戶,但隨著資產安全和使用門檻,可程式帳戶被提出進行抽象,從業務角度來看,CA 作為使用者帳戶後分析的邏輯產生了一些變化,CA 在EVM 中無法主動發起交易,那麼就需要有一個EOA 作為發起地址調用CA 再去調用別的CA,這個EOA 可以是不同的地址,也可以不是CA 的多簽地址之一,對於這些交易,分析的邏輯就會改變。當然目前ERC-4337 還在草稿之中,所以大部分開發者僅僅是在文章中和會議中聽過,並沒有真正開始使用它,在鏈上數據業務中這也是一個相當早期的垂直賽道。
資料來源:Dune
最後,我想打一個不是很嚴謹的比喻,如果一個行業的數據市場最終會占到這個行業總規模的8%,那麼當前1 trillion 市值(我們在2020 年年初到2021 年年末兩年整的時間經歷了從低谷200 billion 到2 trillion 的10 倍增幅)的加密行業大約可以容納80 billion,這在未來還有非常大的用戶和資金增長空間,數據賽道目前僅完成了數據存儲的去中心化,數據計算和數據驗證還有數據處理等等很多階段需要更多的創意。