作者:Jesse Walden,Variant Fund共同創辦人;編譯:0xjs@黃金財經
「數據是新時代的石油。」這個類比很恰當,因為數據是為最具變革性的AI模型提供動力的資源,而且就像原油一樣,數據必須經過處理和提煉才能發揮作用。這個主要由人工主導的過程,即數據標註,在2022 年已經是一個規模達22 億美元的產業,並且在未來幾年有望呈數量級增長。
然而,隨著AI的快速且持續發展,標註需求已經超過了供給。許多客戶無法獲得他們所需的數據,因為標註公司缺乏提供專業服務的熟練勞動力。還有一些客戶則因價格過高而無法負擔。這個高成長但供應受限的產業似乎已經到了亟待創新的成熟階段—— 我們認為加密技術可以成為一個突破。
Variant很高興地宣布,Variant領投了Sapien的1050萬美元種子輪融資,以拓展其去中心化的數據標註網絡。
Sapien簡介
Sapien 背後的主導理念是,可以利用加密技術更快地建立一個更大的標註網絡,同時保持較高的資料品質。該團隊正在建立一個協議,以便比中心化公司更有效率地組織和補償全球範圍內的人工標註員(或「AI工作者」)— 包括兼職人員、熟練工人,甚至是小型企業。以下是我們認為加密技術能讓Sapien 在這領域獲得所需優勢的幾個面向:
1.全球網路:數據標註是一個全球性產業,大型公司(主要位於舊金山灣區)通常會在亞洲設立分支機構,招募當地工人,然後將標註好的數據出售給全球各地的客戶—— 這在不同的銀行、法律和勞動體系之間轉換時會產生摩擦。一個基於網際網路原生的協定是這些不同參與者互動的最順暢平台。 Sapien 可以輕鬆地為客戶或標註員開拓任何新的地域,包括召集全球各地的熟練工人來完成小眾和專業的任務。
2.優化成本結構:Sapien 將使用加密軌道和穩定幣來處理所有支付事宜,並盡可能依靠協議進行協調,而非人工管理。這些創新措施使其能夠實現部分營運冗餘的自動化處理,而這些營運冗餘目前正困擾著該行業,如此一來便能降低成本。
3.代幣激勵:許多新的標註網絡在初期發展階段都舉步維艱,但作為一個代幣化的市場,Sapien 可以利用代幣在更大規模上激勵供給。 Sapien 還可以利用獎勵及其鏈上聲譽系統來設計更好的激勵措施,以提高標註數據的準確性—— 到目前為止,他們所報告的準確率已達99%。最後,分配網絡價值和所有權應該會激勵更多熟練工人加入,因為這能讓他們在網路發展過程中獲得潛在利益。
憑藉這些創新,我們相信Sapien 能夠比其競爭對手發展得更快,同時提供更具性價比的服務。這個模式還處於試驗階段,但如果執行得當,它可能會為整個產業帶來革命性的改變。
儘管Sapien 還是一家年輕的新創公司,但它已經取得了長足進展並正在迅速成長。它的早期客戶包括一些全球最大的企業,如阿里巴巴、百度和好未來,以及知名的AI研究機構,如Midjourney。其網絡涵蓋了來自70 多個國家的參與者,這是透過與諸如Worldcoin 和Yield Guild Games 等大型組織建立合作關係實現的。該網路已經標註了200 多萬個數據點,活躍標註員人數剛剛突破1 萬,且每月以50% 的速度增長。
Sapien團隊
Sapien的發展進程彰顯了其團隊的實力—— 這是一個精簡且精英的行業資深人士團隊。
他們由執行長羅文·斯通(Rowan Stone)領導,他是Base 的創始團隊成員之一,曾協助推出Layer 2;
還有特雷弗·科弗科(Trevor Koverko),他自2017 年起就是以太坊社區的資深成員,也是當時最大的現實世界資產(RWA)協議之一Polymath 的創始人。
團隊中還有其他成員,他們曾在Kraken 負責業務發展,將Flow 區塊鏈推向市場,以及打造傳統人工智慧業務。
在我們看來,對於這個領域而言,他們具備加密原生的市場推廣(GTM)和企業背景的理想組合。