隨著各類AI 技術模型的進一步成熟,AI 正被廣泛應用於包括AIGC、自動駕駛、醫療、大數據分析、汽車製造等在內的許多領域,它透過運算分析在某些場景中智慧執行,讓生產、工作效率得到質的飛躍。
但另一面,AI 計算帶來效率提升的同時,也存在資料外洩的風險。 AI 計算需要以來自於不同領域的數據作為燃料,並在此基礎上進行分析執行,但這些數據可能涉及個人以及商業機密,例如醫療記錄、財務資訊、個人識別資訊、汽車製造參數數據等等等,這也引發了人們對於AI 時代資料安全的擔憂。
一個例子是,在去年,微軟人工智慧研究團隊意外洩露了大量數據,這些數據包括用戶資訊、聊天記錄和郵件等敏感資訊,雖然該事件並未進一步發酵,但許多科技企業開始重新審視AI 數據安全問題。另一個例子是,以具備卓越AIGC 能力的ChatGPT 模型,其就曾被義大利資料保護局曾指控,涉嫌非法收集用戶數據,違反GDPR。而在今年的3 月25 日,OpenAI 官方對ChatGPT 一次臨時中斷服務的調查報告中承認,該起事故中約有1.2% 的ChatGPT Plus 的用戶資料可能被洩露。
Privasea 提出了一種基於全域通態加密技術為基礎的機器學習方案(FHEML),在該方案的支持下,AI 可以在無需解密加密資料的情況下進行處理與分析,杜絕了AI 計算以及機器學習過程中所面臨的資料外洩隱患,該方案符合包括歐盟的一般資料保護規範(GDPR)的在內的系列合規要求。同時,Privasea 透過建構一個DePIN 眾籌算力網絡,以為網絡中所需的龐大運算資源提供強大的支撐。 Privasea 正在為資料保護、AI 計算機器學習、算力供應以及合規等多個方面,找到了一個新的平衡點。
日前,由幣安Labs早期投資的專案Privasea 因其創新的FHEML 解決方案,而備受AI和Depin 領域以及加密市場的關注。目前,該項目已經獲得了兩輪戰略融資,包括在預種子/種子輪融資中,獲得了共計的500 萬美元,以及在近期,又由OKX Ventures 、野村證券Nomura group 控股的Laser Digtal 、軟銀參股的孵化器Tanelabs 等參投的新一輪策略私募輪融資。
本文將進一步對Privasea 計畫進行介紹,以增進讀者對Privasea 的了解。
1.FHE 技術為何能成為AI 領域,杜絕資料外洩風險的重要方案?
FHE( Fully Homomorphic Encryption )即全同態加密,它是一種允許對加密資料進行計算的加密形式,即資料被轉換成了一個數學結構,使得在保持資料加密狀態的同時也能執行計算。這意味著可以在資料保持加密狀態的同時進行處理和分析,而處理的結果仍然是加密的。此後,這些加密的結果可以安全地傳回給資料的擁有者,只有他們可以解密並查看最終結果。
此方案的核心優勢在於,前期為資料安全提供了前所未有的保護層,並且特別適用於AI 運算以及機器學習領域等。例如,在AI 環境中,使用者可以將加密的資料上傳到AI 端(或雲端)進行儲存和運算,而無需擔心雲端服務提供者或其他未授權第三方存取他們的敏感資訊。此外,即使在資料傳輸過程中資料被截獲,沒有對應的解密金鑰,攻擊者也無法理解資料的內容。
所以相對於ZKP(零知識證明)、MPC (多方計算)以及TEE(受信執行環境)等方案,FHE 更適用於AI 領域構建self-custodial數據方案,作為密碼學的皇冠,甚至被很多人認為是end game。
當然,FHE 方案本身也存在一定的挑戰,在這種及其複雜的數學結構中,簡單的算術運算在加密資料上執行時都會變得非常複雜,轉換和維持這種結構需要大量的計算資源。所以對於FHE 方案的運算效率需要大量的算力作為支撐,而龐大的算力消耗也將帶來龐大的運算資源成本。好的一面是,Privasea 正在透過建構一套DePIN 系統,來合理的解決了FHE 方案所面臨的運算資源問題,並推動FHE 在AI 領域的規模性採用。
2.Privasea:基於FHEML 解決方案的DePIN AI 計算網絡
上文提到,Privasea 網路是一個以FHEML 技術方案為基礎,並透過引入區塊鏈激勵層,讓以從分散的資源點中獲得源源不斷的運算資源,其旨在解決AI 領域所面臨的潛在資料外洩問題,並有望成為最安全的AI ML 方案。同時,Privasea 的鏈下資料安全方案,是目前能夠兼顧合規特性,例如滿足歐盟的一般資料保護條例(GDPR)的在內的系列法規。
在Privasea 網路的系統中,包含四個重要的元件,在進行協同運算工作的同時,進一步為系統提供安全和私密的AI 能力:
- Privasea FHE Pipeline
Privasea FHE pipeline是Privasea網路的核心元件。這個函式庫建立在zama的THFE-RS庫的基礎上,並且經過了專門的客製化適配,以便更好地滿足Privasea專案的需求。透過利用zama的THFE-RS函式庫的強大功能,Privasea FHE函式庫能夠提供安全且高效的全同態加密(Fully Homomorphic Encryption)方案,從而保護使用者的資料。
- Privasea API
通往Privasea AI 網路的門戶,Privasea API 為開發者提供了一個應用程式介面,以將保護資料安全的AI能力整合到他們的應用程式中。該組件提供了一系列工具和功能,以實現與網路的無縫互動。
- Privanetix
Privanetix 是一個去中心化的運算節點網絡,利用眾多運算節點的力量來促進加密資料的安全和高效處理。這些高效能運算節點,將共同工作以安全地執行關鍵的機器學習演算法。 Privanetix 中的每個節點都配備適用於各種任務模型的FHEML的pipeline,並能夠以極高的效率對加密資料進行推理操作,以實現在保護資料保密性的同時,支援高效協作式AI 應用。
- Privasea 智慧合約套件
Privasea 智慧合約系統是Privanetix 節點的激勵驅動,該機制有效地追蹤Privanetix 節點的註冊和貢獻,驗證它們的計算,並相應地分配獎勵。透過利用智慧合約,該機制確保了透明度、公平性,並積極激勵網路內的參與,這也是Privasea 網路運算效能的保證。同時,該組件也將以經濟因素為基礎,以防止Privanetix 節點作惡。
基於這套系統,Privasea 為AI 計算,在使用者資料安全、分散式運算資源之間,找到了新的平衡點。而在其通用解決方案的基礎上,期客製化解決方案也具備兩個重要特性,即效率和使用者友善性。即用戶即便沒有密碼學或程式設計能力的用戶,也能夠易於存取。使用者可以輕鬆導航並利用網路的能力,使他們能夠執行FHE AI計算,而無需專門的專業知識。
所以基於Privasea 網絡,使用者可以輕鬆使用FHE 方案,來加密他們的資料或模型,並將它們上傳到Privasea AI 網路中。上傳成功後,使用者就可以存取網路中的分散式運算資源,以加密狀態對其資料進行機器學習或其他運算。網路支援多種運算模型,包括神經網路、決策樹、聚類分析和其他模型,這些模型可以是網路上公開可用的,也可以由使用者提供。
目前Privasea 網路也正在為分散式儲存鏈BNB Greenfield 進行集成,即生態中的資料將透過BNB Greenfield 以分散式的方式儲存。這意味著用戶具備數據的絕對控制權並能靈活利用數據,可以將他們的個人模型,無論是公開還是加密信息上傳到網絡並以分佈式的方式存儲,加密結果可以返回給用戶或者使用FHE 密鑰轉換功能與他人共享。這將進一步提供一種安全分享加密資料的方式,以實現資料價值循環,保護用戶資料並促進資料價值共享。
3.以合規為導向的鏈下資料計算方案
Privasea 網路的特性是鏈下資料安全,完全不涉及資產交易部分,能夠兼顧審查特性而非鏈上完全抗審查,這種方式既透過密碼學嚴格保護了使用者的資料安全,又能在需要時支持合規審計來滿足任何國家在AML、反洗錢的法律規定。
同時,Privasea 網路能夠滿足包括歐盟的一般資料保護規範(GDPR)等在內的系列法規,這些規定對個人資料的收集、處理和儲存都有嚴格的要求。 Privasea 的鏈下特性,確保個人資料在模型訓練和推理過程中得到保護,而不會類似於Worldcoin 收集人類身分資訊資料。
同時,Privasea 網路的另一個關鍵目標是保護使用者的敏感資料免受未經授權的存取。透過在AI 計算、學習期間使用FHE 加密敏感數據,網路充當了防止資料外洩和未經授權的入侵的堅固屏障,進一步透過密碼學技術加強了資料安全。
4.Privasea 系統的潛在用例
Privasea 方案能夠與許多具備驗證、運算分析需求的許多情境高度結合,以用於資料的保護,潛在場景包括生物辨識、醫療、金融、安全雲端資料運算、匿名投票系統等等。
- 生物識別
目前,以Privasea 技術方案為基礎,首個生物辨識(臉部辨識)應用即將面向市場。在該人臉辨識應用中,用戶端安全地嵌套在用戶設備上,以FHE 技術為基礎,透過加密的方式對客戶端金鑰進行保護,同時確保伺服器資料計算過程永久加密,在實現加密人臉比對的同時保護個人資訊。
在該範例中,當使用者透過用戶端上傳其臉部特徵照片時,系統不是發送原始影像,而是在本機將它們轉換為加密向量,保留獨特的屬性,這些向量使用客戶端金鑰進行安全加密,在傳輸到Privasea 網路強化的後端伺服器進行嚴格保護。這也意味著這些原始影像是被封鎖的,使用者可以對Privasea AI 資料庫可信。
而當用戶與替代圖像進行面部匹配時,客戶端在本地提取面部特徵,透過加密保護嵌入向量,並將其安全地發送到我們的伺服器。在密文網域內,伺服器將執行人臉匹配演算法,同時保持資料保密性。經過細緻的處理後,伺服器會提供加密的結果,可以使用客戶端的金鑰專門解密以確認符合。
所以從始至終,使用者儲存在Privasea (實際上,這些加密資料以分散式的方式儲存)中的臉部資料都是以加密的形態存在,並以FHE 方案為基礎在加密的狀態完成臉部對比,從頭到尾不會洩露原始面部數據,並能夠確保數據安全。而以此方案為基礎,能進一步衍生出包括Proof of Human,Secure KYC等在內的一系列類似的應用場景。
- 醫療
Privasea 網路的潛在應用範例可以包括醫學影像處理,例如基於其高效能運算資源來分析一些醫學診斷影像。基於Privasea 網路系統,醫療專業人員和研究人員可以使用分散式的運算資源網路來處理醫學影像,同時保持病患資料安全。
一個例子是,放射科醫生可以使用Privasea AI 網路處理一項研究中的大量醫學影像資料集。這個網路可以用來將處理工作負載分佈在多個節點上,合併結果以提高分析的準確性。在處理和分析階段,患者資料將被加密和保護。
包括X 光或MRI 等在內的掃描醫學影像數據,可以使用FHE 方案進行加密,並以加密數據的形式儲存或傳輸,並透過Privasea AI 對加密的醫學影像進行處理,在這個過程中,網路為AI 處理提供了一個分散式的運算資源網路。此方式能夠有效的保護患者的數據,同時也有望對AI 模型進行有效訓練。而在醫療處理完成後,加密的醫學圖相被解密,可供醫療專業人員使用。
透過結合使用FHE 加密和Privasea AI 網絡,可以在保護病患資料的同時,安全且有效率地處理醫學影像。該系統不僅提升了醫學圖相領域提供了一個可拓展、提升成本效益的解決方案,同時也進一步提升了病患信任。尖端技術的採用,也有望讓醫療效率、醫療水準進一步提升。
在金融領域中,Privasea 網路基於PHE 方案以及Privasea AI 網絡,也能夠為包括銀行交易、貸款審查等在內的系列場景建立資料保護,並有望進一步提升金融機構處理業務的準確率與效率,並有望大幅處理降低成本。
目前,Privasea 已被納入Google Cloud Web3 啟動計劃,這也意味著Privasea 的基於FHE AI 網絡,有望進一步透過更好的Google Cloud service集成,以服務更多的潛在用例。
此外,作為目前FHE 技術領域的佼佼者,Privasea 也始終致力於推動密碼學技術在加密產業的進一步採用。據悉在今年3 月底,Privasea 將聯合Zama等頭部Web3 FHE 賽道的創業公司,開展以「致力於FHE 在web2和web3中的研究發展和應用推動」為主題的閉門學術研討會。此前,該系列技術會議已經連續舉辦三年,並在FHE 技術方案的創新上不斷取得突破。
5.未來展望
在AI 技術的發展過程中,潛在的資料外洩風險正成為最大的阻礙因素,許多人認為AI 的發展甚至正在挑戰資料法規,這也讓具備提升效率的AI 技術目前難以在許多潛在應用情境中落地。而算力資源的不足,也同樣是AI 模型難以有效訓練、AI 技術難以規模性採用的一個重要癥結。
Privasea 系統以FHEML 方案為基礎,支援在加密資料上直接進行複雜計算,為各類場景提供資料保護的同時,兼具可審計性,並符合各類資料法規的要求。同時,Privasea 透過引入分散式的運算網路Privanetix,透過激勵層以DePIN 的方式,吸引不同的運算節點將分散的算力資源引入網路中,建立一套面向Web3 的算力眾籌網絡,這將為FHE 的加密運算、AI 的模型訓練與計算,提供源源不絕的算力支持,並引領新一輪DePIN AI 算力眾籌的全新革命。
在Privasea 網路的推動下,FHE 方案有望被規模性採用,並成為加密領域的主流方案。 AI 也能夠技術也能夠在保證資料安全、符合資料法規的前提下,與法律法規相適配,與各類場景深入的融合,並被廣泛的採用,以更好的成為提升人類生產力的工具。
同時,Privasea 網路也正在建構一套以合規為特徵的資料價值流轉體系,透過建立真正的使用者資料主權,讓資料擁有者掌握資料價值,建構一套全新典範的資料價值體系。以此為基礎,Privasea 預計將成為萬億應用市場的全新價值載體,並不斷凸顯價值。