電影《天下無賊》裡有這樣一句台詞,“21世紀什麼最貴?人才!”
近十年過去,如果把這個句式套在數字化這個大背景下,那最貴的一定是“數據”。
數據被形容為“21世紀的石油和鑽石礦”。根據IDC數據,2020年全球數據量達到59ZB,以數據流通為基底的數字經濟是產業發展的主引擎。
關於數據流通,產業界有一個“三角難題”,即任何單一隱私計算技術無法同時解決“安全、隱私”、“質量、易用性”、“流通性”這三個問題。換句話講,數據在流轉過程中不止是“可用不可見”,還要解決多方協作之間的數據權屬和真實性等問題。
老話講,“跳進黃河也洗不清了”。而在數據流通這個場景,不管數據怎麼“洗”,都需要看到清晰的授權、確權、鑑權關係,這是確保數據能發揮價值的關鍵。
近日,IDC發布報告《隱私計算全景研究2022》指出,放眼於數據流通場景,展望5-10年之後的數據要素市場,區塊鍊等相輔相成的技術能力將顯得不可或缺。
IDC:“隨著隱私計算在數據要素交易市場中扮演更重要的角色,接入跨領域、新場景、更多數量的數據參與方,就注定需要區塊鏈作為信任底座協調參與方間的信任。數據是否造假、數據是否能夠自動化進行授權使用都將運用到區塊鏈。此外,從使用閉環的外部監管的角度看,區塊鏈作用也是不可或缺的。”
為解決數據需要開放卻不能開放的矛盾,我的同事研發了摩斯隱私計算平台,在金融、科研、政務等10多個行業的上百家機構應用;為滿足更大範圍的數據流通和協作需求,他們也正在“隱私計算+區塊鏈”融合技術的方向上探索、努力。
邁向隱私計算原生
去年雲棲大會,螞蟻鏈數據隱私協作平台(FAIR)正式發布,這是一套面向數據價值流轉的原生計算流轉模型。在這個架構上,隱私計算作為一種原生能力與區塊鏈深度融合在一起。
之所以強調“原生”,就是面向數據全生命週期來思考,包括數據確權、數據流轉以及數據價值再分配等問題。正如建築師的腦子裡不止裝著房屋的外立面,各種斗拱穿梁早已是心中有數。
我們拆開來看:
隱私計算主要解決數據共享計算環節中的數據隱私保護問題,在數據加密或者不透明狀態下完成計算和分析;
區塊鏈則側重構建可信協作網絡,通過智能合約實現鏈上數據真實性驗證和審計,呈現清晰、真實的數據權屬關係。
區塊鏈與隱私計算有機結合,能使得原始數據在不出域的情況下,實現多節點之間的可信協同計算和數據隱私保護,發揮出“1+1>2”的價值。
“隱私計算+區塊鏈”具有天然的互補性,但很多產品實質上是松耦合的。
目前,行業內的通用做法是,通過雙系統架構將兩者結合,對於客戶來說,需要採購、配置兩套系統才能實現協作目標,且在協作過程中,兩套系統的適配能力和安全也存在挑戰。
我的同事福鶯這樣說,“未來的行業協作中,數據隱私保護將成為底層需求,我們認為隱私計算應該直接原生在區塊鍊網絡平台上。”
螞蟻鏈數據隱私協作平台不是區塊鍊和隱私計算這兩項技術的簡單相加,而是實現了深度融合,協作流程由智能合約驅動,數據流轉由隱私計算引擎解決,並通過區塊鏈確權、共識。
這一平台在區塊鍊網絡上做了進一步擴展,每一個區塊鏈節點也成為一個隱私計算節點。
福鶯跟我說,像當年智能手機集成電話、相機、音樂播放器等功能一樣,FAIR平台打破了技術邊界,真正意義上實現了區塊鍊和隱私計算的深度融合。
你中有我,我中有你
區塊鍊和隱私計算本就應該是“你中有我、我中有你”的樣子。在這裡可以跟大家分享一個故事:
我的同事裡有很多人之前都是行業線的專家。其中有一位,她叫英之。
在加入螞蟻鏈之前,她幫助一個團隊做了三年的農業數字化項目,可以說把能數字化的都數字化了,包括材料、生產過程、物流等,等到她去銀行申請融資時,銀行只問了她一個問題,“我怎麼trust(相信)?”
憑她三年在數字化上的努力,也沒有找到一個機構願意幫她來背書。她又跟銀行說,“如果整個流程上鍊,你是不是可以相信?”銀行說,可以試一試。
用她自己的話來說,“在數字經濟背景下,一定會走到一個階段,而那會是邁不過去的坎兒,而這必須用技術來解決。”
所以我們回到主題,隱私計算技術算出了一個結果,當它涉及到二次流轉時,中間環節缺失的還是“信任”。
目前,螞蟻鏈數據隱私協作平台(FAIR)已經在政務、金融等多個場景中應用。以政務場景下的“查低保”為例,它需要涉及到多方的信息確認:
第一步,“張三算不算低保戶?”請求指令發出;
第二步:這個指令在民政局、財政局、大數據局等機構中加密計算並流轉,看看張三名下是否有房產、車輛等;
第三步,形成一個“張三是低保”的標籤,再通過區塊鏈記錄。
其實,在經歷第三步之後,“張三是低保”這個標籤的所有權已經是民政、財政、大數據局等機構共同計算所得。
在數據流轉的過程中,經過了加工確權、再加工、再確權,鏈路清晰,權屬清晰。在這裡面,區塊鏈首先提供了多方協作網絡,其次是呈現了真實的確權、授權關係。
獨立倉庫、靈活組搭
針對複雜的數據協作場景,我的同事們把數據隱私協作平台歸納為——FAIR:
可發現(Findable)
可接入(Accessible)可審計(Auditable)
可協作(Interoperable)
可複用(Re-usable)、可回收(Re-cyclable)
這些特徵直接定義出了平台的特徵:
-
支持數據治理規則和分類分級管理,幫助用戶在業務協作中能高效找到數據,每個數據條目都帶有類別/級別/共享規則信息;
-
支持數據權限控制和多數據源接入,多方協作時,可根據在合約中的數據權限進行操作,支持異構數據源接入;
-
通過劃分協作子網、區塊鍊和隱私計算能力融合,靈活適用於不同的協作任務需求;
-
支持數據資產全生命週期流轉,數據可驗證可追溯。
總結一下,FAIR平台為不同隱私等級的數據提供了獨立存儲倉庫,數據使用方也只能“拿一把鑰匙開一把鎖”,對重要數據重點保護;另外,平台上提供可插拔的隱私計算能力,用戶可以直接使用拖拉拽的方式,完成數據的碰撞、計算,並開啟全新流轉。
*平台融合了多方安全計算(MPC)、可信執行環境(TEE)、聯邦學習(FL)三類主流的隱私計算技術,涉及不經意傳輸(OT)、秘密分享(SS)、混淆電路(GC)、零知識證明(ZKP)、差分隱私(DP)、等多種密碼學、隱私保護密碼學原理應用。用戶可以非常靈活地做自己的個性化解決方案。
互聯網時代,大家通過網購形成了“商品物流”,但是在數字時代,數據資產流轉和商品物流是完全不一樣的,數據價值從我到你,從一端到另一端,整個過程中要完全保障各方的權益,這裡面挑戰很大。
我的同事項城跟我說:“基礎技術研究相當於搭建基礎設施,而基礎設施一定要有前瞻性,順應趨勢,只要方向是對的,那基礎技術的應用價值是毋庸置疑的。”