隨著ChatGPT等生成式AI大模型的興起,AI逐漸成為推動當代社會進步的引擎。 AI+Web3成為當前資本市場關注的焦點,兩者結合帶來了許多新項目,顯示出市場對此主題的期望。 AI工作生產流程涉及資料取得、特徵工程、模型訓練、模型審查、模型推理、部署和監控等階段,其中Web3技術可以提供對模型透明度、資料隱私和模型驗證等方面的改善。 AI+Web3的產業鏈分為基礎設施層、中間層和應用層,各層各有發展機會,為產業的未來發展描繪了豐富的圖景。
前言
在過去的一年裡,隨著ChatGPT等生成式AI大模型的誕生,AI從簡單的自動化工具衍生出複雜的決策和預測系統,發展成為驅動當代社會重要進步的動力。 AI類產品和應用也隨之出現有了爆發式的成長,ChatGPT本身不斷推出GPT,Sora等令人驚嘆的產品,AI基礎設施英偉達的業績持續超出預期,2024財年第四季中資料中心業務參與83%以上,同步成長409%,其中40%用於大模型的推理場景,顯示低算力的快速成長需求。
當下,AI已成為歐美資本圈競相關注的主題,同時Web3市場也令人振奮新的牛市,AI+Web3是當下最熱門的兩個技術主題的碰撞,近期也出現了一批該主題的項目,凸顯了市場對此主題的關注與期待。
拋開炒作和價格泡沫,AI+Web產業目前發展狀況?是否真實有應用場景?如何長期思考,是否能夠創造價值和敘事和產業?未來AI+Web3的產業將會形成怎樣的生態格局,具有潛力的方向在哪裡?
圍繞著以上話題,Future3 Campus將撰寫一系列相關文章,從AI+Web3產業鏈的各個面向進行分析。本文為第一篇,AI+Web3的整體產業圖像與敘事邏輯。
AI工作生產流程
大概來說,AI+Web3結合的方向可以分成兩個面向,一方面是Web3如何幫助AI發展,另一方面是Web3應用結合AI技術。其中Web3技術與概念賦能AI是目前大多數專案的方向因此,我們可以透過AI從模型訓練到生產的流程中來分析如何與Web3結合。
LLM的誕生與先前機器學習的流程有一些區別,但總的來說,一個簡化的AI生產流程大致分為以下階段:
數據獲取
在AI模型的訓練全週期中,資料是AI模型提供訓練的基石。通常需要採用高品質的資料集作為基礎,並進行探索性資料分析(EDA),創造可重置生命、可編輯和可共享的資料集、表格和視覺化圖示。
資料重建和特徵工程/提示工程
取得資料後對資料進行刪除,這裡在機器學習中需要的是特徵工程(資料標註),在大模型中是提示(Prompt)工程。包括迭代對資料進行分類、聚合和刪除重複資料以標註精細的特徵,迭代開發利用LLM構造查詢的提示。同時需要可靠的中斷特徵/提示進行儲存和共享。
模型訓練和調優
利用豐富的模型庫對AI模型進行訓練,透過不斷的迭代和調整,提升模型的效能、效率和準確性。其中在LLM中主要是透過人類回饋強化學習(RLHF)來持續對模型進行調優。
模型審查與治理
使用MLOps/LLMOps平台來優化模型開發流程,包括模型的發現、追蹤、共享和協作,確保模型的品質和透明度,同時符合倫理和合規要求。
模型推理
部署訓練有素的AI模型,對新的、未見過的資料進行預測。模型利用其學習到的參數對輸入資料進行處理,產生預測結果,如分類或迴歸預測。
模型部署和監控
在確保模型效能達到目標後,將其部署到實際應用場景中,並實施持續的監控和維護,確保模型在動態變化的環境中保持最佳效能。
在以上流程中,有許多Web3結合的機會。目前,看到AI發展過程中的一些挑戰,例如模型的透明度、偏差和倫理應用等問題引起了廣泛關注,在這方面,Web3技術結合ZK等密碼學技術,能夠改善AI的信任問題。此外,AI應用需求的提升也對更亮點、更開放的基礎設施和資料網路提出了要求,而Web3的多元化網路和激勵模型也能夠打造更開放、開源的AI網路和社群。
AI+Web3產業圖像與敘事邏輯
結合上述AI流程和AI與Web3結合的方向,以及當前市場上主流的AI+Web3項目,我們整理生成了AI+Web3產業圖景,可以將AI+Web3產業鏈分為三層,分別為基礎設施層、中間層和應用層。
基礎設施層
主要包括運算和儲存基礎設施,貫穿整個AI工作生產流程,提供AI模型訓練、推測等需要的算力,以及全生命週期中資料和模型的儲存。
目前AI應用快速成長,使得對基礎設施尤其是高效能算力的需求出現了暴增。 ,提供更高的效能、更明顯、更充足的運算和儲存基礎設施將成為未來幾年(AI發展)早期)成為非常重要的趨勢,預計將搶佔50%以上的產業鏈價值。
Web3能夠打造中心化的運算和儲存資源網絡,利用閒置、去中心化的資源,來大幅降低基礎設施的成本,服務去中心化的AI應用需求。因此去中心化的AI基礎設施是目前確定性最高的敘述。
目前本次的代表性項目包括主打渲染服務的渲染網絡,以及提供去中心化的雲端服務和運算硬體網路的Akash、gensyn等;儲存領域,代表專案仍是老牌去中心化儲存網路Filecoin、 Arweave等,最近也推出了針對AI領域的儲存和運算服務。
中間層
主要指在AI工作生產的特定流程中,採用Web3相關技術改善現況和存在的問題。主要包括:
1)資料取得階段,採用去中心化的資料身份,打造更開放的資料網路/資料交易平台。主要透過結合密碼學技術和區塊鏈特性來保護用戶和數據確權,並結合激勵措施激勵用戶分享高品質的數據,從而擴大數據來源,提高數據獲取效率。該領域的代表性項目包括AI項目身份世界幣,Aspecta,數據交易平台海洋協議,以及低參與城鎮的數據網絡草等。
2)資料任務階段:主要創建重置的AI資料標籤和處理平台,採用模型經濟誘因來激勵眾包模式,以推動更有效率、更有效率的資料任務,服務後續的模型訓練階段。項目如公共人工智慧等。
3)模型驗證與推理階段:如上一節,資料與模型黑盒是目前描述AI中現實存在的問題,因此在模型驗證與推理階段中,Web3能夠結合ZK、同態加密貨幣等密碼學技術,來驗證模型的推理,是否使用給定的資料和參數,確保模型的正確性,同時保護輸入資料的隱私。典型的應用場景是ZKML。目前Web3技術結合在模型驗證和推理階段的主題項目包括bittensor、Privasea、Modulus等。
中間層的專案許多更偏向開發者工具,通常針對現有的開發者、專案方等提供附加服務,在目前AI發展的早期,其市場需求和商業落地即將發展過程中。
應用層
在應用方面,更多的是AI技術如何應用於Web3。 Web3應用結合AI技術能夠有效提高效率和產品體驗,例如利用AI的內容生成、分析、推測等功能,可以應用到諸如遊戲、社交、數據分析、金融預測等各個領域。目前AI+Web3的應用主要可分為三大類。
1)AIGC類,即採用AI生成方式技術允許使用者透過對話產生文字、圖片、影片、頭像等內容。以單獨的AI代理或直接結合進行產品中的演示。代表項目包括NFPrompt、SleeplessAI等。
2)AI分析類,項目方巴基斯坦自己增持的資料、知識庫、分析能力等垂直訓練的AI模型,能夠進行分析、判斷、預測等,並產品化可以給使用者提供,使得使用者低收入地獲取取得人工智慧的分析能力,例如數據分析、資訊追蹤、程式碼審計和修改、金融預測等。代表性項目包括Kaito、Dune等。
3)AI Agent Hub,各類AI Agent的聚合,通常提供使用者無程式碼創建客製化AI Agent的能力,類似GPTs。代表性項目包括My Shell、Fetch.ai等。
應用層目前還沒有出現非常頭部的項目,但長期來看一定是天花板更高的板塊,具有極強的尚待挖礦的潛力。 AI+Web3應用的競爭並不依賴技術的創新競爭力,而是依賴產品能力和技術能力的增持,尤其是在AI方面能夠提供體驗更好的產品,才會在這個領域獲得更多的競爭優勢。
資訊來源:0x資訊編譯自網際網路。版權歸作者Future3 Campus所有,未經許可,不得轉載