數據淘金熱:數據智慧網路DIN全解

作者:Teng Yan,Chain of Thought;翻譯:金色財經xiaozou

1.數據淘金熱

19世紀中期的加州淘金熱期間,成千上萬人在新邊疆追逐未財富希望。

窮人突然發現自己發了財,白手起家的故事變得司空見慣,這股熱潮帶動著更多產業和城市的出現。基礎建設以驚人的速度發展,重塑了美國的面貌。

Crypto AI與淘金熱的相似之處難以忽視。

如今,大多數Crypto AI產品仍處於開發階段,要么就是在測試網路上運行,表明我們正處於基礎設施建設階段。

投資者和建設者正在為迎接潛在的成長激增做準備。現在正在創建的工具、網路和協定可能會成為支援龐大的去中心化人工智慧生態的基礎。

我們正在見證一場數位淘金熱的早期階段──這場淘金熱可能與19世紀的淘金熱有著同樣的變革性。

所以可以想像,當我偶然發現一個自稱日活躍用戶超過70萬的Crypto AI專案時,我有多驚訝。不是月活躍用戶,而是日活躍用戶哦。在這樣一個新興領域,這樣的使用者指標可以說是聞所未聞的。所以,我必須進行深入研究,弄清楚幕後到底發生了什麼事。

這是什麼項目? DIN,即「資料智慧網路」。

2、加密資料網絡

我一直在密切關注Crypto AI領域裡的數據網絡,很明顯,它們正在解決AI領域的一個關鍵痛點:價值性數據集的存取。

如今,許多最有價值的資料來源都被集中實體嚴格控制著,這些實體收取高昂的存取費用。

例如:

  • Reddit與OpenAI簽署了一份每年6000萬美元的授權協議,提供對其用戶生成內容的存取權。

  • X(以前的Twitter)不再向開發者提供免費的API訪問,現在Twitter數據的收費在每月100美元到4.2萬美元之間(不是開玩笑)。

其中傳達的訊息很明確:企業意識到數據是新的戰場,他們正在鎖定控制權以實現利潤最大化。

Crypto提供了一個潛在解決方案——一種擺脫對價值性資料集的集中控制的方法。

加密資料網路採用了一種完全不同的方法,旨在建立高品質的去中心化資料集,不存在傳統模型帶來的瓶頸。透過代幣的使用,這些網路可以激勵大規模的資料標註工作,激勵個人為大規模資料收集做出貢獻,甚至組織訓練資料的網路抓取。

而區塊鏈具有透明性,創造了一個追蹤資料的所有權和來源的框架。這便確保了每當貢獻者的數據被使用時,他們都能得到公平的補償,從而建立了一個新範式,在這個範式下,數據價值是共享的,而不是壟斷的。

3.DIN願景

DIN是迎難而上正面處理資料問題的團隊。

DIN的核心是一個資料層,它收集並驗證鏈上鏈下數據,使用區塊鏈作為結算層。

主要理念是什麼?那就是將資料的所有權交還給用戶,讓他們因為系統所做的貢獻而獲得獎勵。

DIN工作原理:

IvkiOmojOZvKoA3KCJfngJKiltvDWVqZJxqVfVGp.png

這個圖表可能乍看很複雜,讓我們來分拆一下。

DIN網路有三方主要參與者:

  • 數據收集者

  • 數據驗證者

  • 計算節點

為了更好地理解資料收集者和驗證者是如何運作的,我們來深入了解xData,也就是DIN目前的主產品。

(1)xData:資料收集

xData是DIN的旗艦平台,主要用來收集、組織和儲存來自X等社群媒體平台的數據,而不必依賴API。它運行在一個去中心化網路上,確保用戶的所有權和隱私。它於2024年4月在opBNB (BNB鏈的一個L2)上推出。

57obi8Cu1gmaBsPvAwfZNJH7W6KZ1DoEFuoq2Rdy.jpeg

xData透過遊戲化機制讓使用者的資料收集變得具有趣味性和獲利性。下面讓我們快速了解一下它是如何運作的:

  • 用戶安裝一個瀏覽器插件,用錢包登入並關聯他們的X帳戶。

  • 用戶可以透過回覆推文和tag帳號來tag有趣的推文。

  • 用戶在tweet上tag可以獲得「wafers」積分,這些積分可以在TGE時轉換成代幣。

  • 這裡有幾種遊戲化機制。每個用戶可以tag(儲存)的推文數量有限,但他們可以透過消費wafers積分來增加儲存空間。用戶還必須每24小時消費一次wafers,以保持帳戶的「解鎖」狀態,才能賺取更多wafers。

  • DIN圍繞特定的關鍵字或標籤發布任務,社群成員即時搜尋推文並根據特定標籤進行tag。

xData無需許可的特性意味著世界各地的任何一個用戶都可以參與資料收集和註釋來獲得獎勵/收入,不受國籍的限制。目前,資料收集是在鏈下進行的,被tag的推文儲存在BNB green field上,這是BNB Chain上的去中心化資料層。

(2)Chipper Nodes:資料驗證

下一個問題自然是:如何確保使用者所提交資料的品質和完整性?畢竟,有人可以為了獲取最大利益而運行一個人工智慧機器人,隨機tag與指定標籤不匹配的推文。

資料標籤也不總是直截了當的。推文通常包含暱稱、俚語和文化因素——例如,比特幣在中文推文中經常被稱為「大餅」。

這就是資料驗證的用武之地。

Chipper nodes是DIN的人工智慧驅動的數據驗證和處理節點,負責驗證和向量化數據,同時也讓用戶能夠賺取代幣(xDIN和DIN)。

在幕後,每個用戶操作的節點實際上是本地運行一個小型AI模型來驗證推文的內容是否與附加標籤匹配,然後將其儲存在去中心化資料層中。使用者可以在標準PC上操作這些節點,不需要昂貴的硬體設定。

隨著處理的經驗證數據的數量越來越多,驗證者使用的人工智慧模型不斷改進,使網路隨著時間的推移變得更聰明、更準確。

目前,DIN可內部處理所有資料驗證,但目標是分散驗證流程。目前正在對節點進行主動測試。用戶可以在他們的本地設備上運行節點軟體來測試網絡,DIN準備在未來幾週內發布其主網和代幣,bug獎勵已就位。

(3)計算節點

雖然運算節點還沒有投入使用,但它們卻是DIN未來安全儲存資料的隱私計畫。以下是計算節點的工作原理:

  • 向量轉換:計算節點將經驗證的資料轉換為向量。

  • 隱私處理:向量透過ZK(零知識)處理器處理,確保隱私。

  • 資料最終確定性:最終確定的資料集和向量儲存在IPFS中供第三方存取。

BNB鏈上的一個新L2?

IKxU1AkQ29SkU5eFDaNkecGVscqJnstqLYZ675mJ.jpeg

官方尚未發佈公告,但在我們的研究中,我們在BNB鏈測試網上發現了一個DIN代幣。這暗示了未來區塊鏈的發展——可能是BNB鏈上的側鏈或L2解決方案。

DIN簡介:

DIN給人的感覺像是一個新玩家,但該專案的起源可以追溯到2021年底。它最初以「Web3Go」的名義推出,是Polkadot生態中的一個鏈上資料分析平台,獲得了Web3基金會的資助,並與Moonbeam和Oak Network等客戶合作。

2022年,團隊將業務範圍擴展到BNB鏈生態,加入了幣安實驗室的MVB孵化器,並獲得了開發「多鏈開源資料分析平台」所需的投資。

到了2023年7月,他們看到徵兆:生成式人工智慧正在蓬勃發展,對強大資料基礎設施的需求比以往任何時候都更加迫切。於是團隊轉向建立一個全面的“人工智慧數據智慧層”,使他們的使命與人工智慧創新的數據需求保持一致。這一演變在2024年5月達到高潮,屆時,Web3Go正式更名為DIN,標誌著對數據的大膽關注,預示著數據層將成為下一波人工智慧進步的關鍵。

4.DIN的牽引力-目前為止勢頭良好

opBNB的日用戶數約為70萬。

k36Y8TS0njCUuzl0OKSec5ZjuRS2rkbsopPjHUFE.png

opBNB上的DIN日交易量約120萬。

97CPvqyX1fbXqUGqbk0GpuoWZCLlftSf2Y5k5i5K.png

根據DappBay的數據,DIN在10月表現穩定,平均每日用戶數超過70萬,每日交易量超過120萬。大多數交易是因為xData用戶必須每24小時進行一次鏈上交易,以啟動他們的xData app賺取積分。

KT89fWJqMLtpR0bSXnhNSyPi6Fx4ThgVQNlTAkAt.jpeg

DIN一直是BNB鏈上排名前十的dApp之一,而且在很多時候,它還是網路上用戶數排名第一的應用程式。雖然我沒有像密切關注Solana和Base這樣密切追蹤BNB鏈生態,但這不是一個小成績,特別是考慮到BNB鏈的推出時間和幣安的強大支持。

為了更好地理解,我分析了BNB鏈上其他一些排名靠前的應用,看看究竟是什麼塑造了用戶黏性:

  • Vooi (DeFi)是一個perp DEX聚合器。

  • Particle網路(基礎設施)是測試網中的全鏈協定。

  • Revox (基礎設施)是一個模組化鏈上網絡,擁有一個受歡迎的內容app——ReadON。

  • SERAPH(遊戲)是一款類似Souls的RPG遊戲。

  • MyShell是一個無程式碼的AI應用商店生態。

據該團隊稱,到目前為止,DIN已經收集並標註了超1億條推文,在opBNB和Mantle上的用戶群超過3千萬。

這裡要注意的是,DIN能夠利用其龐大的用戶群,快速產生大量相關推文的即時資料集。這個過程完全不依賴X API。

雖然xData目前的重心是Twitter,但該團隊計劃將資料收集和標註平台擴展到Reddit、Facebook、Instagram等其他資料來源,以及任何具有高價值資訊的用戶資料平台。對我來說,這才是真正的黃金所在。

Reiki:

GWf5fTYf5XgCxDksq981gZQlWwc0Vk4mByBDIIh5.jpeg

Reiki是DIN的另一款產品,它與正在進行的AI智能體meta緊密相連。事實上,考慮到最近幾週我們在Truth Terminal和GOAT身上看到的消費者對AI智能體的潛在興趣,DIN可能已經走在了時代的前沿。

2024年1月,DIN推出了Reiki平台,用戶可以在沒有程式設計經驗的情況下創建AI智能體(主要是聊天機器人)。用戶還可以整合自己的知識庫,建立引人入勝的、個人化的聊天機器人,這讓人想起了MyShell。

該平台一發布便迅速獲得關注,成為Product Hunt上排名第一的產品。

Reiki還為創作者提供了多種方法,讓他們能夠將自己的機器人貨幣化,參與獎勵計劃,甚至將他們的機器人變成NFT——為遊戲體驗添加了有趣的一層——所有權。值得注意的是,BNB Chain的Discord知識支援機器人是由Reiki驅動的。

雖然該平台目前基本上已經被棄用,但DIN團隊並不排除在他們發布代幣後將其迎回的可能性。如果重新啟用,Reiki可以為代幣提供額外效用,並為AI智能體創建者提供一種方法利用xData所收集的資料。

5.代幣設計:xDIN、DIN和節點銷售

Wq8kttLyRdNY1eHndlzU8t7w6vxvdU5PyMX0Gn04.jpeg

2024年8月至9月,DIN舉行了Chipper節點銷售並從中籌集了250萬美元。這些chipper節點將允許用戶在他們的本地設備上運行驗證軟體,使用模型來確保數據被準確地標註。這次銷售非常成功,25,112個二級節點(每個售價99美元)全部售罄。

供應端:

在TGE之前,xData用戶可以將他們的wafers積分兌換為xDIN——空投前代幣。然而,會有5-30%的兌換費,這些費用將分配給Chipper節點所有者。這種兌換機制還沒有上線,但預計在本月稍後節點「預挖」上線後就會立即啟動。

在TGE期間,用戶將根據其持有的xDIN比例獲得DIN(可交易代幣)空投,完全釋放,沒有複雜的鎖定機制。

在TGE之後,DIN代幣總供應的25%將保留給Chipper節點獎勵。這筆配額的一半將在第一年釋放,餘下的每年減半釋放。

需要注意的是,與其他進行節點銷售的項目相比,該銷售的解鎖速度是相對較快的,其他項目的節點獎勵是在3-4年內逐步分配的。

需求端:

驗證者節點可能需要質押DIN代幣才能參與網路。作為回報,他們將因驗證數據而獲得獎勵,但如果他們的產出不準確,他們將面臨罰沒懲罰。

在另一端,資料使用者必須使用DIN代幣才能存取網路資料。由於大多數Web2企業仍對使用加密貨幣猶豫不決,該公司將需要促成這些交易,以架起傳統企業與去中心化網路之間的橋樑。

我們仍在等待詳細的DIN代幣經濟學的公佈,應該會在接近TGE時發布。

團隊與融資:

DIN的核心團隊聚集了來自哥倫比亞大學、倫敦大學學院和斯圖加特大學的人才,他們在人工智慧和區塊鏈領域擁有長達十年的專業知識。

DIN的創辦人Hao Ding擁有斯圖加特大學資訊科技碩士學位。在深入研究加密貨幣之前,他曾擔任中國蘇州人工智慧研究所的研發主任,隨後擔任身份認證oracle網路Litentry的副總裁,後來創立了Web3Go。

我很高興見到Hao本人,我們暢聊了人工智慧的未來。如果你問我他的信念是什麼?那就是:數據將是一切的核心。 DIN團隊目前有16名成員,大部分都是工程師。

DIN參與了幣安實驗室的MVB 5加速器計劃,並於2023年7月在種子輪融資中籌集了400萬美元,領投的是由幣安實驗室、HashKey、NGC和Shima Capital。 2024年8月,DIN獲得了另外400萬美元的融資,參投的有Manta Network, Moonbeam Network、Ankr和Maxx Capital,使其總融資額達到800萬美元。

6、我們的想法

想法1:創造一個去中心化Scale AI是件趣事

vfQtCW2nrXFcYFthWqyhNqpjXWYwTH4CU9RPn8X1.jpeg

資料收集和標註是一筆大生意。

Scale AI是這一領域最知名的參與者,每年的經常性收入約為10億美元。這是由OpenAI、Anthropic和Cohere等基礎人工智慧模型公司的大量需求所推動的,它們是Scale的主要客戶。截至2024年5月,該公司的估值高達140億美元。

讓我們仔細看一下Scale AI的商業模式。

Scale的資料標註任務依賴龐大的分散式勞動力,包括手動tag視訊、分類照片和轉錄音訊。

該公司在多個國家僱用了約24萬名工作者,並在失業率高、生活成本較低的地區積極招募。例如,肯亞已成為非洲重要的招募中心,在內羅畢設有面授培訓的“新兵訓練營”,並有針對性地發布付費廣告吸引工作者。

標註過程通常有兩層:第一層是註釋者,他們從頭開始標註資料;第二層是品質控制者,他們檢查工作,添加缺少的標註並糾正錯誤。這是一項人力密集型工作,但卻很有效,因為人力成本很低,而且客戶願意支付大筆資金。

現在,想像一下透過去中心化網路來擴展這個模型。受代幣激勵的全球範圍內無需許可的工作者,可以允許任何人參與,同時,分散式驗證網路可以確保資料的準確性和品質。去中心化可以為擴展資料標註開闢新的可能性,將其變成一個真正的全球民主化過程。

想法2:龐大的用戶基群=好事

DIN今天的主要優勢在於其規模龐大的黏性社區,這些社區是透過兩年多的專注於社區建設的努力建立起來的。有了這樣的網絡,DIN可以根據特定標準快速調動資料收集。然而,挑戰在於確定真正的數據需求在哪裡,指導用戶收集和標註正確的數據集,並建立可持續的收入流以支持長期成長。

想法3:激勵是一把雙面刃

現在,大部分的用戶黏性都是由代幣發布後對代幣獎勵的預期所驅動。但如果團隊無法在代幣發布之後為代幣帶來足夠的需求,那麼隨著最初的興趣消退,代幣使用率可能會下降。創造這種需求需要投機興趣,並建立一個由渴望購買這些數據集的消費者組成的數據消費者市場。

想法4:數據標註是一個競爭激烈的領域

DIN並不是唯一一個爭奪這一市場份額的加密團隊——像Sapiens、Grass和Masa這樣的項目也在競爭之中。但這塊蛋糕是巨大的。以GRASS為例,該公司目前的市值為25億美元,突顯出該產業的機會之大之多。

DIN與競對區分並脫穎而出的一個途徑可能是訓練和部署專有人工智慧模型進行資料驗證,減少對人力的依賴。這種自動化優先的方法可以簡化操作,增強可擴展性,並使DIN比仍然嚴重依賴手動操作的競爭對手更具優勢。

7.結語

數據網路是人工智慧和加密交叉領域最令人興奮的一個陣地。與傳統的集中式模型不同,Crypto驅動的資料網路利用去中心化參與和激勵機制來大規模建立高品質資料集。

DIN將自己定位為該領域的先驅,見證這個計畫的發展過程將是一件令人著迷的事。這是DIN需要抓住的機會。我常告訴人們:數據網路是目前最明智的建設領域之一。

Crypto正在重塑資料的收集、驗證和貨幣化方式,為新型去中心化資料經濟奠定基礎。

Total
0
Shares
Related Posts