從Web2到Web3:資料規模帶來的新問題

作者:Kerman Kohli 來源:substack 翻譯:善歐巴,金色財經

現在是2024 年,你會認為取得加密資料很容易,因為有了Etherscan、Dune 和Nansen,你可以隨時查看想要的資料。表面上確實像這麼回事。

規模

你看,在正常的web2 領域,當你的公司有10 名員工和100,000 名客戶時,你產生的數據量可能不超過100 GB(處於上風)。這個資料規模足夠小,你的iPhone 可以處理你的任何問題並儲存所有內容。然而,一旦你有1,000 名員工和100,000,000 名客戶,你處理的資料量可能現在有數百TB,甚至PB。

這從根本上來說是一個完全不同的挑戰,因為你要處理的規模需要更多的考慮。要處理數百TB 的數據,你需要一個分散式電腦叢集來發送作業。在發送這些作業時,你必須考慮:

  • 如果工人未能履行職責會發生什麼情況

  • 如果一名工人比其他工人花的時間長得多,會發生什麼情況

  • 你如何確定給哪個工人分配哪個工作

  • 如何將所有結果合併在一起並確保計算正確

這些都是在處理跨多台機器的大數據計算時需要考慮的事項。規模會產生一些問題,而這些問題對於不使用它的人來說是看不見的。數據是這樣的領域之一,規模越大,需要的基礎設施就越多,才能正確管理它。對大多數人來說,這些問題是看不見的。要處理這種規模,您還面臨其他挑戰:

  • 知道如何操作這種規模的機器的極其專業的人才

  • 儲存和計算所有資料的成本

  • 前瞻性規劃和架構,以確保您的需求能夠得到支持

有趣的是,在web2 中,每個人都希望數據公開。在web3 中,終於可以公開了,但很少人知道如何做必要的工作來理解它。一個欺騙性的事實是,透過一些幫助,你可以相當輕鬆地從全局資料集中獲取你的資料集,這意味著「本地」資料很容易,但「全局」資料很難獲得(與每個人和每件事有關的東西)。

碎片化

好像事情已經不具挑戰性了,因為你必須處理的規模。現在有一個新的維度讓加密資料變得具有挑戰性,那就是由於市場的經濟激勵,加密資料會不斷分裂。例如:

  • 新區塊鏈的興起。目前有近50 個L2 已上線,50 個已知即將上線,還有數百個正在籌備中。每個L2 其實都是一個需要索引和配置的新資料庫來源。希望它們是標準化的,但您不能總是確定!

  • 新型虛擬機器的興起。 EVM 只是一個領域。 SVM、Move VM 和無數其他虛擬機器正在進入市場。每種新型虛擬機器都意味著一種全新的資料方案,必須從基本原理和深入理解的角度來考慮。有多少虛擬機器?投資者將以數十億美元的投資激勵新事物!

  • 新帳戶原語的興起。智慧合約錢包、託管錢包、帳戶抽象化為您實際解釋資料的方式帶來了新的複雜性。寄件者地址可能實際上不是真實用戶,因為它是由中繼提交的,而真實用戶可能在混合中的某個地方(如果您仔細查看的話)。

由於你無法量化你不知道的東西,碎片化可能特別具有挑戰性。你永遠不會知道世界上存在的所有L2 以及總共會出現的虛擬機器。一旦它們達到足夠的規模,你就能跟上,但這是另一個故事了。

開放,但不可互通

我認為最後一個問題讓很多人感到驚訝,那就是資料是開放的,但不能輕易實現互通。你看,團隊拼湊起來的所有智慧合約就像一個大型資料庫中的小型資料庫。我喜歡把它們看作模式。所有的數據都在那裡,但開發智慧合約的團隊通常知道如何將它們拼湊在一起。如果你願意,你可以花時間自己去理解它,但你必須對所有潛在的模式進行數百次這樣的操作——而且,在沒有交易另一方買家的情況下,你怎麼能不花大筆錢就做到這一點呢?

如果覺得這太抽象了,我來舉個例子。你說「這個使用者使用橋樑的頻率是多少?」。雖然這看起來是一個問題,但裡面嵌套了許多問題。讓我們來分解一下:

  • 首先,你需要知道所有存在的橋樑。還有你關心的鏈。如果是所有鏈,那麼我們上面已經提到了為什麼這很有挑戰性。

  • 然後,對於每座橋樑,你需要了解它們的智能合約是如何運作的

  • 一旦你理解了所有的排列,你現在需要透過一個可以統一所有這些單獨模式的模型來推理

上述每個挑戰都很難解決,而且需要大量的資源。

結果

那麼這一切會導致什麼呢?好吧,我們今天的生態系狀況是…

  • 生態系統中沒有人真正知道真正發生了什麼。只有難以正確量化的活動概念。

  • 使用者數量虛高,女巫攻擊難以偵測。指標開始變得無關緊要和不可信!真假對市場參與者來說甚至不重要,因為它們看起來都一樣。

  • 使鏈上身分真實化的主要問題。如果你想擁有強烈的身份意識,準確的數據至關重要,否則你的身份就會被扭曲!

我希望本文能幫助您了解加密資料領域的現實情況。

Total
0
Shares
Related Posts