區塊鏈與人工智慧之間的協同與衝突

最近這些年,區塊鏈領域鑼鼓喧天,人工智慧(AI)領域鞭炮齊鳴,但這兩大變革性技術卻似乎交集不多。但從概念上看,區塊鏈和AI 有不少互補之處,例如區塊鏈技術固有的去中心化特性也許可以幫助解決AI 的中心化問題,區塊鏈透明且可驗證的性質或許有助於解決AI 模型的不透明問題。

前段時間,「區塊鏈X AI」的概念炒作讓不少相關加密貨幣市值大增,整個板塊的市值一度超過200 億美元,如圖1 所示。這顯示市場對這組合相當看好,投資人也頗有信心。

圖1:不同細分領域的加密貨幣市值,2024 年4 月18 日數據

但是,區塊鏈和AI 的整合實踐中也暴露出了這兩者存在的一些衝突之處,例如AI 需要密集計算和大量存儲,而區塊鏈的分散式帳本架構則強調冗餘——每個節點都會儲存和計算相同的資訊。

近日,清華大學和Fraunhofer HHI 等機構的一個研究團隊發布了一篇論文《Blockchain and Artificial Intelligence: Synergies and Conflicts》,分析了區塊鍊和AI 之間存在的技術協同和衝突。值得注意的是,該團隊並沒有埋頭分析理論,而是著眼於加密貨幣市場,分析了市值超過1000 萬美元的「區塊鏈X AI」項目和一些特定用例。

UEPZRqMFmqGk0mNuCS5KNorVNI5WDthDeThemoDy.png

下面我們就來看看這篇論文講了啥,得到了什麼有趣或有用的見解。

區塊鏈X AI:協同與衝突

圖2 展示了區塊鏈與AI 之間的互補與對立之處。

PwCbry1bbUTw60c7qdZem8ndHS6oYFl3X7VUCsJB.png

區塊鏈和AI 的協同之處

去中心化與中心化。 GPT 等目前最佳的大型語言模型(LLM)的訓練和維護需要大量算力、電力和資料資源。舉個例子,2020 年發布的GPT-3 的訓練過程的計算成本約為460 萬美元。如此高的成本讓AI 大模型成為了少數幾家大型科技公司的角力場——它們也基本上成為了AI 市場的壟斷者。這樣的壟斷可能會妨礙競爭,這也是美國和歐洲等地區的政策制定者經常表達的擔憂——這些地區在執行反壟斷法方面非常積極,以維持市場平衡以及防止市場被單一實體主導。相較之下,區塊鏈技術則是去中心化的;這樣的特性或許能用於解決AI 系統的中心化問題。只要部署得當,區塊鏈的去中心化特性可防止任何一方控制整個網路。此特性可協助在AI 系統內實現某種監管機制,實現更平衡的權力分佈,並促進各方協同合作。因此,整合區塊鏈技術可望解決AI 領域內有關監管和壟斷的爭論,使AI 治理更加包容和公平。

透明度與黑箱本質。區塊鏈技術的另一個主要特點是透明,其上的交易和記錄都是可驗證且不可竄改的。另一方面,AI 卻宛如一個黑箱——人們很難明晰其決策背後的推理過程。也許我們可以使用區塊鏈帳本來記錄AI 的決策過程,實現透明的審計跟踪,從而提升AI 應用的可信度。此外,區塊鏈還能整合先進的加密技術(如zk-SNARK 等零知識證明)或使用安全硬體(如Trusted Execution Environments/可信任執行環境/TEE)。這些技術可協助驗證特定的計算步驟是否忠實且準確地執行。

數據管理和依賴。區塊鏈可透過智慧合約與星際文件系統(IPFS)等協議監管資料與資料存取權限。

開源與閉源。區塊鏈可透過加密協議實現共享所有權,進而實現細粒度的隱私配置,從而解決AI 專有模型的限制。如果能讓共享式AI 系統(由參與者聯合訓練和控制)的表現達到商業模式的水平,那麼AI 發展的透明度將會大幅提升。這也能促進人們創造更公正和全面的人工智慧解決方案。

區塊鏈和AI 之間的衝突

儘管區塊鏈和AI 之間有上述協同共進之處,但它們之間的營運需求卻存在重大衝突,妨礙了這兩者的整合。

計算成本和負載。對於GPT-4 和Llama 3 等大型語言模型(LLM),訓練和推理都需要大量計算資源。區塊鏈的共識機制、加密操作和不利的資料結構都會增加運算負擔,進而影響可擴展性。

儲存限制和資料密集度。區塊鏈的去中心化特性儘管能確保安全和冗餘,但也會導致顯著的儲存需求,這對資料驅動的AI 系統來說無疑是高成本和低效的。在以太坊等通用區塊鏈系統(GBPS)中,每個節點都必須儲存所有訊息,因為冗餘能保證該區塊鏈網路的安全性和彈性,但卻不利於可擴展性。由於以太坊虛擬機器(EVM)上的新資料都會儲存成交易格式,那麼EVM 結構上的常見資料可能會有礙檢索的速度。另一方面,AI 應用則會產生和處理大量數據,這需要高效且可擴展的儲存解決方案。

偽匿名和安全性挑戰。區塊鏈允許透過非對稱加密實現無許可、偽匿名的存取;而針對可能出現的女巫攻擊(Sybil Attack),則可透過設定計算或資金屏障來保護網路。另外,某些用例是將區塊鏈用作提升隱私保護和分散式AI 訓練的平台,使用的技術包括聯邦學習等;而如果這些用例支持偽匿名地參與訓練過程,則可能出現風險。

這些方法容易被對抗式聯邦學習攻擊攻破,而想要確定惡意攻擊者的身份卻非常困難,因為根據設計,向整體AI 模型提交的貢獻是私密的並且難以測量。

操作不匹配。大多數區塊鏈虛擬機都使用了固定的帳本操作以確保結果是確定的——這很重要,畢竟金融交易涉及的都是錢。而浮點運算則可能在計算中出現精度損失,尤其是當計算數量級相差巨大的多個數值時。但是,AI 訓練的常見做法是將浮點參數歸一化到0 到1 之間,因為這有助於實現穩定有效的梯度流並提供隱式的正則化,從而提升整體訓練效果。

區塊鏈X AI:用例研究

基於上述區塊鏈和AI 的協同與衝突,可以來看看用例了。該團隊研究了在整合區塊鏈和AI 方面做得最好的一些項目。他們關注的重點是已有產品,並發行了代幣且市值超過1000 萬美元的項目。另外還有一些市值雖低於1000 萬美元,但用例新穎的項目。他們基於三個研究問題對這些項目進行了分類:

  1. 該專案內區塊鏈和AI 技術協同整合的程度如何?

  2. 區塊鏈在該專案中的作用?

  3. AI 在該專案中的作用?

聚類分析結果如圖3 所示,其中包含4 個主要聚類:AI 是區塊鏈的外圍技術、AI 參與到區塊鏈中、區塊鏈管理AI 過程、區塊鏈是AI 的核心基礎設施。

vSwM04MoZigQpzSqiLE9RaLQLhr5qDwsORSTbqsN.png

AI 是區塊鏈的外圍技術

AI 可協助提升與區塊鏈互動的使用者體驗、實現智慧化分析、簡化區塊鏈應用的開發流程等。

AI 參與區塊鏈中

AI 可以積極參與區塊鏈生態系統和治理結構中。團隊在論文中給了兩個探索方向:一是讓AI 智能體作為參與者或利害關係人加入到分散式網路中,例如讓AI 自己在Dex 上炒幣;二是讓AI 參與治理DAO (去中心化自治組織),不過目前來看這方面還比較困難。

區塊鏈管理AI 流程

現在人們越來越多地使用區塊鏈技術來管理AI 流程,為資源共享、資料管理和應用部署創建一個去中心化框架。

區塊鏈是AI 的核心基礎設施

以太坊等通用區塊鏈系統(GPBS)面臨這可擴展性、安全性和去中心化的三角權衡。

以以太坊為例,其安全性由分散在全世界的數千個節點保證,驗證者數量已超過100 萬。為了達成共識和最終確定(finality),每個新的資訊區塊都必須到達這個全球網路的每個節點並被每個節點驗證,而每個區塊的大小都在千字節量級並且每12 秒創建一個,這會導致高昂的儲存和計算成本。

因此,直接在鏈上執行或儲存運算密集型的AI 操作是不切實際的;但現在Layer2 rollup 正在成為一個比較熱門的範式。簡單來說,Layer2 rollup 就是指不在鏈上而在鏈下處理交易,之後將處理結果匯集後再記錄到鏈上;這種解決方案既能提升吞吐量,也能降低成本,頗具成本效益。

類似地,專門為AI 用例開發的區塊鏈必須(1)克服與高計算和存儲成本、公共訪問和底層虛擬機限制相關的挑戰以及(2)將區塊鏈單純用作純管理、治理和安全層。表1 展示了將區塊鏈用作核心基礎設施的新系統。

GAETZaiUm6f1wB5QejsRPIcX1IEWNvmMnuhcI7ll.png

表1:將區塊鏈用作AI 的基礎設施,其中DAI = 分散式人工智慧、BC = 區塊鏈、DT/FL = 分散式訓練/聯邦學習、C-Layer = 計算層、TA = 技術分析、DM = 分散式管理、PoS = 權益證明、 DPoS = 委託式權益證明、dBFT = 委託式拜占庭容錯、FL = 聯邦學習、DID = 去中心化身分、ZK = 零知識、DePIN = 去中心化實體基礎設施網路、DC = 分散式計算、DD = 分散式資料、ASBS = 特定應用的區塊鏈系統、IPFS = 星際檔案系統、* = 成熟度低/沒有公共代碼,? = 資訊不可用。

Total
0
Shares
Related Posts