AI 需要Web3

DePIN (去中心化物理基礎網絡)是一個令人興奮的新類別,在硬件上提供了一種替代燃料,以推動Web3 和AI 創新的複興。

作者:Catrina Wang

編譯:CoinTime237

直到最近,初創企業一直引領技術創新的道路,因為它們具有速度快、敏捷、創業文化以及擺脫組織慣性的自由。然而,在快速增長的AI 時代中,情況發生了變化。到目前為止,像微軟旗下的OpenAI、英偉達、谷歌甚至是Meta 這樣的大型科技巨頭一直主導著突破性的AI 產品。

那麼出了什麼問題?為什麼這一次“Goliaths”勝過了“Davids”?雖然初創企業可以編寫出很棒的代碼,但由於幾個挑戰,它們往往無法與大型科技巨頭競爭:

1、計算成本仍然極高;2、AI 存在一個叫做“反向阻塞”(reverse salient)的問題:缺乏必要的監管措施,會因對社會影響的擔憂和不確定性而阻礙創新;3、AI 是黑盒子;4、已經擴展的參與者(大型科技公司)的數據鴻溝為新興競爭對手設置了障礙。

那麼,這與區塊鏈技術有什麼關係,它在何處與人工智能相交?雖然不是萬能的,但在Web3中,DePIN(去中心化物理基礎網絡)可以通過解決上述挑戰來提高AI 技術。在本文中,我將解釋如何利用DePIN 背後的技術,從四個維度增強人工智能:

1、降低基礎設施成本;2、驗證製作者身份和人性;3、注入民主和透明度到AI 中;4、為數據貢獻安裝激勵機制。

在本文的語境中,1、“Web3”被定義為下一代互聯網,其中區塊鏈技術是其中的一個重要部分,還包括其他現有技術;2、“區塊鏈”是指分散和分佈式賬本技術;3、“加密貨幣”是指使用代幣作為一種激勵和分散機制。

第一,降低基礎設施成本(計算和存儲)

基礎設施可負擔性的重要性(在AI 的語境下,是計算、傳遞和存儲數據的硬件成本)在卡洛塔·佩雷斯(Carlota Perez)的“技術革命”框架中得到了突出體現。該框架提出,每一次技術突破都有兩個階段:

1)安裝階段以大量VC 投資、基礎設施建立和“推動”上市(GTM)方法為特徵,因為客戶對新技術的價值主張還不清晰。 2)部署階段以基礎設施供應的迅速增加為特徵,這降低了新進入者的門檻,同時以“拉動”GTM 方法為特徵,表明客戶渴望更多尚未建立的產品並且存在強烈的產品-市場契合度。雖然ChatGPT 已經有了明確的產品——市場契合度和巨大的客戶需求,人們可能認為AI已經進入了部署階段。然而,仍然缺少一件事情:過剩的基礎設施供應,使其價格便宜到足以滿足價格敏感型的初創企業進行構建和實驗。 1、問題問題在於,物理基礎設施領域當前的市場動態主要是垂直一體化寡頭壟斷,其中像AWS、GCP、Azure、Nvidia、Cloudflare 和Akamai 這樣的公司享有高額利潤。例如,AWS 在商品化計算硬件上估計有61% 的毛利潤。

  • 對於AI 新進入者來說,計算成本過高,尤其是在LLM 方面。
  • ChatGPT 的訓練成本約為4 百萬美元,硬件推理成本每天約為70 萬美元。
  • Bloom 的第二版預計將需要花費1000 萬美元進行訓練和重新訓練。
  • 如果ChatGPT 被部署到Google 搜索中,將導致谷歌營收減少360 億美元,這是從軟件平台(谷歌)到硬件供應商(Nvidia)的巨大盈利轉移。

2、解決方案DePIN 網絡(例如Filecoin、Bacalhau、Render Network 和ExaBits)可以通過以下三個槓桿,實現75%-90% 以上的基礎設施成本節省。這些網絡是自2014 年以來集中於積累規模化互聯網硬件用於分散數據存儲的先驅,而Bacalhau、Render Network 和ExaBits 則是協調層,將需求與CPU/GPU 供應進行匹配。 (聲明:作者曾是Protocol Labs 的員工和ExaBits 的顧問)

1)推高供應曲線,創造更具競爭性的市場DePIN 使硬件供應商能夠成為服務提供商,民主化了硬件供應商的准入。它通過創建一個市場,讓任何人都可以加入網絡作為“礦工”,提供他們的CPU/GPU 或存儲能力以換取財務獎勵,從而給這些既得利益者帶來競爭。雖然像AWS這樣的公司在用戶界面、操作卓越性和垂直整合方面無疑享有17 年的領先優勢,但DePIN 解鎖了一個以前被中央化提供商定價過高的新客戶群體。就像Ebay 不會直接與Bloomingdale 競爭,而是引入更經濟實惠的替代品來滿足類似的需求一樣,DePIN 網絡不會取代中央化提供商,而是旨在為更注重價格的用戶群體服務。

2)通過加密經濟設計平衡這些市場的經濟DePIN 創建了一種補貼機制,以引導硬件供應商參與網絡,從而降低終端用戶的成本。為了理解它的工作原理,讓我們首先比較一下AWS 和Filecoin 中存儲供應商的成本和收入。

A、DePIN 網絡可以為客戶降低費用:DePIN 網絡創建了競爭性市場,引入Bertrand-style的競爭,從而為客戶降低費用。相比之下,AWS EC2 需要中間50% 的利潤率和31% 的總利潤率來維持運營。 B、通過發行代幣獎勵/區塊獎勵作為新的收入來源,DePIN 網絡可以提供更多優惠。在Filecoin 的上下文中,託管更多實際數據意味著存儲提供商賺取更多的區塊獎勵(代幣)。因此,存儲提供商有動力吸引更多客戶和贏得更多的交易以最大化收入。幾個新興計算DePIN 網絡的代幣結構仍然保密,但可能會遵循類似的模式。這些網絡的示例包括:Bacalhau:一種協調層,將計算帶到數據存儲的地方,而無需移動大量數據ExaBITS:一種專門針對人工智能和計算密集型應用程序的分散計算網絡

3)降低開銷成本:DePIN 網絡,如Bacalhau 和ExaBITS 以及IPFS/內容尋址存儲的好處包括:A、從潛在數據中創建可用性:由於傳輸大型數據集的高帶寬成本,存在大量未開發的數據。例如,體育場館產生大量事件數據,目前未被使用。 DePIN 項目通過在現場處理數據並僅傳輸有意義的輸出來解鎖此類潛在數據的可用性。 B、通過本地攝入數據降低運營成本,如數據輸入、傳輸和進口/出口。 C、最小化共享敏感數據的手動過程:例如,如果醫院A 和B 需要合併各自的敏感患者數據進行分析,他們可以使用Bacalhau 協調GPU 功率直接在本地處理敏感數據,而不是通過繁瑣的行政程序與對方處理PII(個人可識別信息)交換。 D、消除重新計算基礎數據集的需求:IPFS/內容尋址存儲具有內置屬性,可以去重、跟踪血統並驗證數據。以下是有關IPFS帶來的功能和成本效益的進一步閱讀。 3、總結AI 需要DePIN 以獲取負擔得起的基礎設施,而當前市場上由垂直一體化寡頭壟斷。 DePIN網絡如Filecoin、Bacalhau、Render Network 和ExaBits 通過民主化硬件供應商的准入並引入競爭、通過加密經濟設計平衡市場經濟以及降低開銷成本等方式,可以提供75%-90%+ 的成本節省。

第二,Creatorship & Humanity 驗證

1、問題最近的一項調查顯示,50% 的人工智能科學家認為,人工智能導致人類毀滅的可能性至少有10%。這是一個令人警醒的想法。人工智能已經引起了社會混亂,我們目前缺乏監管或技術保障架構——所謂的“反向跳板”。

不幸的是,人工智能的社會影響遠不止於假的播客辯論和圖像:1)2024 年的總統選舉週期將是其中之一,這是一個由深度偽造的人工智能生成的政治競選活動,很難與真實的競選活動區分開來。 2)對參議員伊麗莎白·沃倫進行修改的視頻,使其看起來像沃倫在說共和黨人不應該被允許投票(已被揭穿)。 3)仿冒拜登批評跨性別女性的聲音克隆。 4)一群藝術家對Midjourney 和Stability AI 提起集體訴訟,指控未經授權使用藝術家的作品來訓練侵犯這些藝術家商標並威脅他們生計的AI 圖像。 5)一首名為“Heart on My Sleeve”的深度偽造人工智能生成的原聲帶,由The Weeknd 和Drake 演唱,在被流媒體服務下架之前廣受關注。圍繞版權侵犯的爭議是一個預示,當一項新技術進入主流意識之前沒有必要的規則時,可能會出現的複雜情況。換句話說,這是一個反向跳板問題。如果我們可以在Web3 中通過加密證明對AI 進行一些保護怎麼樣? 2、解決方案1)通過區塊鏈上的加密源頭證明,證明創作者身份和人類身份。這就是我們可以利用區塊鏈技術的地方——作為包含區塊鏈上不可篡改記錄的分佈式賬本。這使得可以通過檢查其加密證明來驗證數字內容的真實性。

2)數字簽名證明創作者身份和人性為了防止深度偽造,可以使用數字簽名生成加密證明,該數字簽名是唯一的原始內容創建者的簽名。此簽名可以使用私鑰創建,只有創建者知道,可以使用公鑰驗證,所有人都可以使用。通過將此簽名附加到內容上,可以證明內容是由原始創作者創建的,無論他們是人還是AI,並且對此內容進行了授權/未經授權的更改。

3)使用IPFS 和Merkle 樹證明真實性IPFS 是一種去中心化協議,使用內容尋址和Merkle 樹引用大型數據集。為了證明文件內容的更改,將生成Merkle 證明,該證明是顯示特定數據塊在Merkle 樹中的哈希列表。每次更改時,會生成一個新的哈希並更新Merkle 樹,提供文件修改的證明。

這樣的加密解決方案可能會面臨激勵與獎勵的問題:畢竟捕捉深度偽造生成器不會產生像減少負面社會外部性那樣多的財務代價。責任很可能落在主要的媒體分發平台,如Twitter、Meta、Google 等身上,他們已經在進行標記。那麼為什麼我們需要區塊鏈呢?答案是這些加密簽名和真實性證明更有效、可驗證和確定性。今天,檢測深度偽造的過程主要是通過機器學習算法(例如Meta 的“Deepfake Detection Challenge”、“Google 的不對稱數字系統”(ANS)和c2pa)來識別視覺內容中的模式和異常,這有時不准確,並且正在落後於越來越複雜的深度假貨。通常需要人工審核的干預來評估真實性,這既低效又昂貴。

想像一個世界,在這個世界中,每個內容都有其加密簽名,以便每個人都能可驗證地證明創作的來源並標記操縱或偽造——一個新的勇敢世界。 3、總結人工智能對社會構成了重大威脅,深度偽造和未經授權使用內容是主要問題。 Web3 技術,如數字簽名證明創作者身份和人性和使用IPFS 和Merkle 樹證明真實性,可以通過驗證數字內容的真實性和防止未經授權的更改來為AI 提供保障。

第三,AI 中註入民主

1、問題如今,人工智能是由專有數據和專有算法組成的黑匣子。這種大型科技公司的封閉性導致了“AI 民主”的不可能性,即每個開發者甚至用戶都應該能夠為LLM 模型貢獻算法和數據,並從模型的未來利潤中獲得一部分(如本文所討論的)。

AI 民主=可見性(能夠看到輸入到模型中的數據和算法)+貢獻(能夠為模型貢獻數據或算法)。 2、解決方案AI 民主旨在使生成式AI 模型對每個人都可訪問、相關且擁有。下表比較了今天可能的情況和區塊鏈技術在Web3 中將可能實現的情況。

1)如今A、對於消費者:B、對於開發者:很少可重複性,因為沒有數據上執行過的ETL 的可追溯性80% 的數據科學家時間被浪費在執行低級別數據清理工作上,因為缺乏可驗證共享數據輸出的能力

2)區塊鏈將會使之成為可能:A、對於消費者:用戶可以提供反饋(例如關於偏見、內容審查、輸出的細粒度反饋)作為連續微調的輸入

B、對於開發者:去中心化數據策劃層:眾包繁瑣和耗時的數據準備過程,如數據標註可見性和能力來組合和微調算法,具有可驗證且基於血統(即他們可以看到過去所有變化的防篡改歷史記錄)數據主權(通過內容尋址/IPFS 實現)和算法主權(例如Urbit 實現數據和算法的點對點組合性和可移植性)從開源模型的基本變體中不斷湧現出的創新LLM 產生了加速創新的推動通過區塊鏈不可變記錄過去ETL 操作和查詢的可重複性訓練數據輸出(例如Kamu)可能會有人認為Web2 的開源平台是一個折中方案,但由於本文所述的原因,它仍然遠未達到最優狀態。 3、總結大型科技公司的封閉性導致了“AI 民主”的不可能性,即每個開發者或用戶都應該能夠為LLM 模型貢獻算法和數據,並從模型的未來利潤中獲得一部分。 AI 應該對每個人都可訪問、相關且擁有。區塊鍊網絡將使用戶能夠提供反饋,為模型變現貢獻數據,並使開發者俱有可見性和能力來組合和微調算法,並具有可驗證和基於血統的特點。 Web3 創新,如內容尋址/IPFS 和Urbit,將實現數據和算法的主權。通過區塊鏈的不可變記錄過去ETL 操作和查詢的可重複性訓練數據輸出也將成為可能。

第四,設置數據貢獻激勵

1、問題如今,最有價值的消費者數據是大型科技平台的專有業務鴻溝。技術巨頭沒有太多的激勵去將這些數據與外部方共享。

那麼,為什麼不直接從數據原始發起人/用戶獲取這些數據呢?為什麼不能通過貢獻我們的數據並開源它供有才華的數據科學家使用,使數據成為公共物?

簡而言之,沒有激勵或協調機制可以實現這一點。維護數據和執行ETL(提取、轉換和加載)的任務會產生顯著的開銷。事實上,僅數據存儲行業就將在2030 年成為價值7770 億美元的行業,還沒有計算計算成本。為什麼有人會在沒有任何回報的情況下承擔數據管道工作和成本呢?

例如,OpenAI 最初是開源和非盈利性的,但由於賺錢不易,陷入了困境。最終,在2019年,它不得不接受微軟的注資,並關閉了其算法對公眾的開放性。到2024 年,OpenAI 預計將創造10 億美元的收入。 2、解決方案Web3 引入了一種稱為dataDAO 的新機制,促進了從AI 模型所有者到數據貢獻者的收入再分配,為眾包數據貢獻創建了激勵層。

結語

總之,DePIN 是一個令人興奮的新類別,在硬件上提供了一種替代燃料,以推動Web3 和AI 創新的複興。雖然大型科技公司主導了AI 行業,但利用區塊鏈技術競爭的新興參與者也有潛力:

DePIN 網絡降低了計算成本的門檻;區塊鏈的可驗證和分散特性使真正的開放式AI 成為可能;創新機制,如dataDAO,激勵數據貢獻;區塊鏈的不可變和防篡改屬性提供了創作者身份的證明,以應對有關AI 的負面社會影響的擔憂。

展開全文打開碳鏈價值APP 查看更多精彩資訊

Total
0
Shares
Related Posts