現今,數據已然成為了比肩石油的基礎性關鍵戰略資源,正顛覆各個行業的發展模式。隨著數字經濟的建設以及數據產業市場規模的迅速擴大,數據在各行業領域不斷地產生、流動、交易所。
眾所周知,數據共享流通是釋放數據價值的關鍵環節,而隨著數據交易所、共享力度的加大,其權屬、合規性、安全性等諸多險開始顯現,出現了數據共享難以及隱私無法得到保障等問題。如何在保證安全、隱私的前提下,實現數據的共享、流通,釋放數據的價值是亟待解決的難題。
數據共享業務現狀
目前的各個行業、領域都存在數據擁有方因為眾多因素而導致無法順利地進行數據共享的問題。包括:
“不願”共享,數據擁有方無法從共享數據中獲益,行業缺乏數據價值評估體系,同時對各個共享參與方的激勵缺失。
“不敢”共享,數據的安全性和隱私性訴求無法得到滿足,數據一旦離開原使用場景便會變得不可控,存在不當使用或濫用風險,危害自身利益。同時,缺乏共享數據實時監測手段以及數據使用授權機制,也存在著無法獲取共享範圍、共享參與方合法性問題。
“不易”共享,各機構信息標準不統一。不能獲得持續、多源的、標準化的數據資源,阻礙了數據交易所以及共享效率的提升。
針對當前數據共享面臨的三個痛點,業內提出通過區塊鏈+隱私計算技術解決這些問題。
1 隱私計算
隱私計算解決最核心的數據隱私問題,排除數據持有方“不敢”共享的顧慮。隱私計算技術包括安全多方計算技術(MPC)、可信執行環境(TEE)、聯邦學習(FL)這三類技術實現隱私數據的安全共享。
其中,安全多方計算主要解決在無可信第三方的情況下利用多方數據安全地進行計算,保證各數據擁有方除了計算結果以外不暴露其他任何數據,用於進行隱私的算術運算、集合運算以及統計分析。可信執行環境主要依賴可信硬件,通過借助CPU芯片構建一個可信的執行環境,可以在該環境中對加密貨幣數據進行解密計算,外部(操作系統,BIOS等)無法獲取該數據,從而保證原始數據的隱私安全。
實際應用中,需要在安全多方計算或TEE之上封裝應用協議,才能在具體場景中利用隱私計算技術,場景包括聯合查詢、聯合統計、聯合建模、聯合預測。
聯合查詢:隱私集合運算,包括隱匿查詢、隱私交集、差集和並集等運算。
聯合統計:數值運算,包括數據的隱私加減乘除、平均數和方差等運算。
聯合建模:隱私計算建模能力,支持多方不暴露隱私數據情況下聯合訓練模型。
聯合預測:隱私計算的預測能力,支持參與方離線執行或在線預測訓練好的模型。
2區塊鏈
區塊鏈技術提供共治共管能力,負責整個數據流通過程中各個數據參與方、數據使用方以及數據流通基礎設施運營方之間的可信協作。區塊鍊為數據共享過程中的三個痛點均起到了關鍵作用。
解決“不願”共享問題:區塊鏈聯盟治理提供數據流通過程中各個參與方之間的協同治理機制以及數據要素可信數據流通的服務管理機制,通過基於區塊鏈智能合約的投票策略進行聯盟參與方利潤分配參數調整、聯盟成員准入移除、系統升級改造等事務管理工作,解決數據共享者的激勵問題。
解決“不敢”共享問題:與隱私計算通過直接解決數據隱私問題、從而排除“不敢”共享的顧慮有所不同,區塊鍊是保障數據流轉過程中,數據使用、授權、監管的真實性,來幫助消除數據方因擔心數據濫用、數據未經授權、偽造授權使用而帶來的“不敢”共享的顧慮。通過智能合約確權授權服務提供各個數據的權屬關係確認以及權限控制能力,並結合數字身份等有效機制確保數據的確權和授權精確到人;追溯審計服務支持可信數據流通過程中的關鍵步驟上鍊登記,同時基於可信數據提供多維度、全方位的記錄審計能力,方便監管機構對數據流通進行全流程監管查詢。
解決“不易”共享問題:區塊鏈技術提供鏈上數據目錄+數據流通任務生命週期管理等能力,為共享過程提供便捷檢索和順暢協作服務。其中鏈上數據目錄記錄了所有參與數據流通的數據的元信息,包括數據名稱、所屬單位、訪問方式、發佈時間,借助區塊鏈不可篡改的特性提供可信數據的檢索、分類、校驗等服務;數據流通任務生命週期管理包括分佈式隱私計算任務的生命週期管理、任務狀態管理、參與方管理等。
區塊鏈提供了共享安全性以及可信的存儲,引入數據共享合約實現數據鏈上精準授權,以及提供數據供需撮合,記錄收授、予取的流轉交易所記錄。通過區塊鏈完成數據使用憑證頒發,撤銷,使用過程中的糾紛Arbitrum。
數據共享的流程
上面從宏觀上介紹了組成基於區塊鏈的數據共享平台的兩個核心技術,以下從共享流程展開,以流程來串起整個技術脈絡。
概要地講,區塊鏈提供可信元信息存儲媒介,通過構建一個數據協作網絡,在網絡之上建模、實現業務共享流程。通過構建業務計算模型,模型按鏈上元信息編程,模型隨流程流轉,使用本地數據執行,在流程運行、流轉中完成共享目標。過程中不同機構的數據不需出庫、僅計算結果進行共享和傳遞。
1 參與者角色
數據提供方,數據的所有者。數據提供方將本地用戶的數據經過加密貨幣學進行處理。
發起方,共享結果需求者。向平台提供共享任務請求。
參與方,指數據交易所共享任務實際執行者,自己也提供本地數據參與計算。
協調者,計算任務的協調者,調度流程,計算任務執行。
在一次共享任務流轉中,數據提供方,參與方各自可以有一個或多個,協調者必須參與。
2 共享流程
基於區塊鏈的數據共享平台為各種數據源構建一套在網絡中協作、共享的數據表示、索引、定位、查詢、交易所和數據追溯審計的統一實現標準,並提供業務流程定制等能力,支持快速開發、部署和實現共享業務、開展業務合作,實現機構間數據的可信互聯互通,解決數據協作過程中的安全隱私問題。
流程分為數據提供方的發布和數據需求方的獲取使用,整個過程分兩部分:
(1)數據提供方的發布流程
導入:數據上傳至本地數據共享節點。導入提供了數據管理的需求,導入過程會對數據進行統一的表示。根據導入的數據類型不同,進行不同的處理,會有分片,文件系統服務。
命名:通過自描述的數據結構,形成網絡唯一的ID,也提供文件系統路徑的概念。提供數據在網絡中的定位、查找能力。
發布:發布可共享數據的元信息(如數據標題、數據使用描述等)至區塊鏈,可為某些機構設置默認的數據訪問權限。
同步:將數據元信息同步至基於區塊鏈的數據共享平台,基於區塊鏈的數據共享平台是鏈上數據匯集的集合,任意方可查詢,獲取此處的數據。
(2)數據需求方的獲取流程
需求方獲取數據,編排業務流程,啟動數據共享,節點會根據流程的指示分派共享任務,同時節點的虛擬機會加載業務計算模型,利用本地數據執行計算邏輯。
檢索:通過基於區塊鏈的數據共享平台檢索所需的數據,包括數據的統一描述以及鏈上元數據信息,這些信息構建了檢索的索引。
請求:請求相關數據的訪問憑證Token,提供平台內的積分機制,根據數據發布方式,請求數據時會進行積分轉移、數據授權記錄上鍊。當數據是授權訪問時需要向數據提供方發起數據訪問申請,獲得數據提供方審核後智能合約頒發的Token。
獲取:數據請求方通過自身的業務定制流程以及計算模型,根據流程流轉到不同的機構,通過網絡的節點ID以及獲取到的Token向提供方獲取數據,基於區塊鏈的數據共享平台點對點傳輸數據或計算結果。
使用:計算模型會使用授權得到的或者積分購買到的數據,通過加載模型來使用本方數據,計算得到結果。
總結
區塊鍊和隱私計算技術儘管發展迅速,但是相關的應用落地仍然不足,目前的數據流通方式仍以原始數據傳輸的方式為主,數據隱私安全問題亟需解決。數據流通行業從業務發展、技術演進、政策及標準的製定等方面都呈現出快速發展的形態。數據價值要能夠最大限度地被挖礦,數據就必須進行充分的流通,傳統數據處理技術在隱私安全方面做得不夠,一定程度上製約了數據流通,隨著區塊鏈、隱私計算、大數據等多方可信協作和數據處理技術的不斷發展,以及國家政策法規、標準的不斷完善,數據的安全共享、流通也將逐步得到解決,數據價值也將逐步得到釋放。
作者| 高文俊
視覺| 王朋玉
統籌| 祖德光
轉載自:中國光大銀行科技創新實驗室
資訊來源:由0x資訊採集自互聯網。版權歸作者“銀行科技研究社”所有,未經許可,不得轉載