來源:Empower Labs
3月23日,飽受爭議的Stability AI CEO Emad Mostaque 宣布辭職,未來將全心投入去中心化AI事業。這消息引起了市場上不小的震動。
Stability AI一方面曾獨自扛起開源AI的旗幟,為開源AI做出了重要的貢獻;另一方面又不斷被指責將其他研究團隊的成果攬在自己頭上。而CEO Emad假學歷的曝光和在社群媒體上頻繁的大話令其聲譽進一步受損。曾經擁有閃耀的投資人支持和巨額融資,Stability.AI卻早已深陷財務困境,命懸一線。
辭職後,Emad透露自己仍持有Stability.AI的大部分股份,足以控制董事會。他不是被迫辭職,而是認為在AI領域,權力的高度集中對每個人都是有害的,因此選擇辭職以促進Stability.AI的改變。由於Emad有著不光彩的吹牛史,大多數人都認為事情不僅如此簡單。不過比起Stability.AI,我更想探討Emad將要投身的去中心化AI。
幾週前,我與Emad一同參與了一場圍繞去中心化AI的討論。之後我又整理了他過去關於這一議題的許多發言,粗略的梳理出了他的視角。
誰控制了模型,誰就控制了思想
如果人類的行動是由作業系統驅動,AI正快速成為這個作業系統的外部核心元件。因為人類已經逐漸適應將思考負擔外包給AI,這個技術構成了我們思考方式的一部分。然而AI所帶來的便利與賦能,也伴隨著顯著的風險──誰控制了AI模型,誰就一定程度上控制了這個世界的思想。
如果大眾對這些智慧工具的工作原理和預設設定缺乏認識,我們的決策和觀點可能會悄悄地受到影響。 AI模型的控制者可以透過設定特定預設選項,潛移默化地引導人們的選擇、觀點及行為。 AI作為下一個時代的基礎設施,如果只被少數商業團體所控制,後果可能是災難性的。這就是Emad所強調的,去中心化AI的重要性和迫切性所在。
每個國家都需要有自己的模型
當OpenAI投入巨大的精力在超級對齊(Super Alignment)項目時,誰來負責OpenAI本身和全世界每個國家,每個行業,每種文化的對齊?
沒有人。
OpenAI的Super Alignment在基礎安全和人類共同的倫理道德方面做出了很大的努力,但面對不同國家和文化的多樣性,這樣的努力是否足夠? 不同民族和文化往往有著與矽谷精英迥異的價值觀,而這些多元價值觀能否公平地反映到AI模型中?當像肯亞這樣的國家,他們的下一代學生開始大規模使用矽谷AI學習時,他們獨特的國家文化特色是否會逐漸消失?
答案很不樂觀。因此Emad認為每個國家、每個產業、每種文化,都應該擁有代表自己特色的AI模型。這些模型應該深深紮根於當地,充分吸收和體現這個國家、產業和文化的集體智慧。這個概念大家應該也不陌生,因為兩個月前英偉達也在各種場合講了主權AI的概念,本質上是一個東西。不過Emad早在一兩年前就開始在各種場合來講這個事,還是比英偉達早了很多。
這個世界上的絕大部分國家根本沒有能力創造自己的AI模型,而這正是Emad瞄準的市場。他希望透過創建一個底層堆疊來支持每個國家、民族、產業創建的AI模型。而在堆疊上,則希望用去中心化集體協作的方式來實現模型的發展。
Emad曾表示可能會啟動/孵化一系列的公司,每個公司會有不同的專業人才聚焦在不同的關鍵領域,如教育,醫療,金融,當然也包括針對不同國家的AI模型。而作為去中心化AI的實踐,這些公司更扮演的是啟動器的角色。透過提供基礎模型、標準化的框架,來引入社區人才參與貢獻。如果能吸引到一個國家的大量優秀人才來參與貢獻,這些集體智慧最終會匯聚為一個優秀的國家模型。
核心是數據
用一個簡單的比喻,AI模型的配方就是演算法和數據,然後用一些算力把它們攪拌在一起,數據越多,需要攪拌這些數據的算力就越大。目前市面上絕大部分的團隊都在追求更好的模型演算法,拿到更多的數據,然後配以更大的算力。但實踐已經證明,如果數據品質高,用更少的數據量同樣能取得優秀的效果。換句話說,人們在透過堆算力為低品質數據擦屁股。
這構成了Emad推崇的去中心化AI體系的一個優點。他相信,如果能建立一個結構來引導一個國家的優秀人才共同參與,就能集結出高品質的國家數據集,同時這些數據可以做到可驗證、所有權清晰,並可以由此設計圍繞數據的激勵模式。
透過這種方式,我們能收集到過去根本接觸不到的資料。這些數據不僅品質更高,能更真實、更公正地代表大眾的聲音和需求。
小模型集群vs 單一大模型
在AI領域,Scaling laws 幾乎成了一條鐵律,無論我們是否選擇追求它,都無法迴避它。
很顯然,採用去中心化的方式來組織資源,再透過Scalling Law實現通用人工智慧(AGI)短期內並不現實。在相當長的一段時間內,以社區為導向的AI模型也難以與像OpenAI這樣的巨頭競爭,爭奪最強大模型的桂冠。
然而,追求AGI和創造廣泛適用的AI是兩回事。隨著技術的不斷進步,社群驅動的中小型模式正在迅速提升能力。預計一兩年之內,中小模型就足以勝任大部分日常任務。也許它不是最強,但它足夠實用,成本也足夠低,可以打開廣闊的應用場景。就像我們買的大部分網購並不需要用順豐隔日達一樣,模型的混合使用未來會逐漸主流化。
這就帶來極為重要的一個變化,當集體智慧驅動的模型被廣泛應用時,就大幅減少了單一大模型由單一機構控制所帶來的潛在風險。如果大型模型的數據出現污染,這些基於集體智慧的模型也能輕鬆扮演校準器的角色,進行必要的修正。這不僅是關於實用性和成本節約,更是集體智慧與AI上帝之間的賽局。
從技術角度來看,小型模型也不完全是劣勢。規模小使得他們更容易針對垂直領域進行額外的訓練。在這些領域內,儘管綜合能力可能不如大型模型,但它們能作為專家級工具發揮出色的性能。而一個由眾多專家模型構成的小模型集群,在與單一大模型的競爭中還真不一定會輸。
更重要的是模型小能夠有效促進部署的去中心化。在談到去中心化時,我們不僅指的是模型的建構和資料來源的去中心化,還包括治理的去中心化以及部署的去中心化。如果開源模型能很方便的部署在個人的筆記型電腦甚至是手機上,這會構成AI平權。即使是中心化的服務提供者如果關閉了服務,用戶仍然可以依靠本地AI繼續操作。讓人們可以不受限的廣泛使用AI也是去中心化AI的重要目標。
AI + Web3 – 騙子還是未來
毫無疑問,Emad正在積極推動的去中心化AI計劃與加密技術密切相關。他已經表明要設計一種Web3協議,以整合並實現他的這些構想。這是因為AI領域目前缺乏的幾個關鍵元素──資料的可驗證性、資料所有權、大規模協調與激勵機制、以及集體治理能力──正是Web3技術所擅長的領域。
在這裡我想著重提一下治理。因為從來沒有一種技術像今天的人工智慧一樣強大,並且即將廣泛且深入地影響世界的各個角落。誰該決定這項技術的未來方向?誰能有效掌控它?由少數公司如OpenAI的董事會來治理人工智慧一定不是最有效的方案。簡單地由監管層對AI模型設定一些硬枷鎖也不一定能有效應對挑戰。集體治理可能才是真正的解決之道。
在Web3領域,集體治理的實驗正興盛發展,涵蓋了資料治理、應用治理、網路治理以及組織治理等多個層面。雖然大部分嘗試仍處於探索階段,也經歷了多次失敗,但這裡是人類治理發展的最前線。
在過去的五年中,加密領域裡,特別是圍繞去中心化自治組織(DAO),人們幾乎嘗試了人類歷史上所有的治理模式。 OpenAI採用的由非營利基金會控制盈利公司的創新結構,在DAO裡早已經被廣泛實踐過。在我看來,Web3世界的人們在過去幾年就像是打了一場治理速通遊戲。人們在短短幾年內重新演繹了人類數千年的治理歷程。
一個最常見的批評是大部分Web3治理不過是把過去人類已有的治理模式複製了一遍然後加上了個鏈上投票。不過歷史已經告訴我們,當擁有如此快速的成長速度和很高的人才密度的時候,很快就會進化出全新的事物。
一個不那麼恰當的例子是網路廣告。記得網路剛興起的那幾年,打開新聞網站,一個巨大的全螢幕廣告會突然出現然後緩慢消退,而網頁上佈滿了密密麻麻的廣告區塊,這成了早期網路的標誌性記憶。因為那時候人們並不知道什麼是更有效的網路推廣方式,所以乾脆就是把傳統媒體上的廣告方式簡單搬到了網路上。然而隨著場景的進步,隨著人們對網路科技以及文化理解的加深,很快就進化出了人類歷史上從未有過的高效推廣模式,並迅速在網路上淘汰掉了傳統廣告。
在我看來對科技的治理也會走過類似網路廣告的路徑。區塊鏈技術帶來了大幅加強的協調和治理能力,人類歷史上從未有過的集體治理方案將從中成長出來,對此我充滿了信心。
寫在最後
放在當下預測AI時代的未來以及檢視Emad的全部構想,很難得出一個結論。顯然,他的計劃在許多層面面臨巨大挑戰。再加上Emad過去常誇大其詞,區分出他的話哪些可以當真,哪些只是隨口說說也不太容易。
然而探討AI的權力結構是一個處於早期、又極為複雜且重要的議題。 Emad和其他追求去中心化AI的同儕們,他們的思考,他們所做的嘗試,雖然可能還遠遠沒有接近最終答案,但值得給予足夠的尊重和關注。這些探索雖然步履艱難,卻是開創未來的勇敢嘗試。這些努力,無論結果如何,都將成為歷史史詩中的一章。
也許有一天,這個世界會感謝Emad們。