9000字詳解數據治理和數據分類分級

數據大爆炸已經成為了一個趨勢

導讀:8月6日,華矩科技數據治理系列講座活動第十期圓滿召開,賽迪智庫信息化與軟件產業研究所所長兼中國軟件評測中心副主任吳志剛帶來分享《強化數據分類分級,提高企業數據管理能力》,以下是分享內容節選。

01 數據分類分級提出的背景數據的價值

1.數據爆炸時代,數據量呈指數級增長

我們要如何看待數據這個話題。數據大爆炸已經成為了一個趨勢,隨著數字化轉型的步伐逐步加快,數據的誕生不斷加快。我們已經真正步入到一個大數據的時代。每個人每時每刻都在產生大量的數據,隨著移動互聯網的應用和傳感網絡的普及,我們的數據呈海量式增長,根據IDC發布的報告中統計,到2025年,全球的數據量將達到史無前例的163ZB。

80%以上的應用,將實現雲化,加上物聯網、智慧城市、人工智能、5g等新技術的應用,將不斷的縱深發展,使得數據量有機會實現海量的增長。 IDC研究的報告表明,我們每兩年可獲取的數據量將翻一番。這是我們看到的一個數據發展的過程。

因此我們真正進入到了一個數據爆炸的時代,瘋狂的大數據使我們沉入到了一個數據海洋中。

2.數據成為數字時代重要戰略資源

回顧數據發展的整個過程會發現,數據已經成為當代的戰略性的資源。從上世紀四十年代到八十年代,由於計算機的昂貴、體積大、能耗高,往往只限於國防、氣象、科研研究的一些領域。那時候一台計算機是有幾個房子那麼大,數據的存儲量不是很高。而進入到了信息技術的1.0時代,也稱為IT時代,這一時期是以單機應用為主要特徵的數字化階段,以數字化辦公和信息管理系統逐漸代替純手工數據,此時的數據僅限於辦公等信息。信息化1.0階段的特徵是數據信息描繪(映射)現實。

從上世紀九十年代中期到2015年,隨著網絡發展,特別是互聯網的興起。以互聯網為應用特徵的網絡化,加速了數據的傳播、流通和匯聚,數據呈現海量的、多樣性、時效性、低價值密度等一系列特徵。網絡促進了我們彼此的交流溝通,將各個方面的事情組合起來。這時候數據驅動現實模式的改變。電子商務的興起,電子政務的廣泛應用,使我們真正進入了網絡的時代,就是“IT+”時代。

進入到2015年,特別是大數據技術的興起,我們實際上是進入到真正意義上的數據時代:以數據的深度挖掘和融合應用為特徵的智能化時代。特別是傳感網絡無處不在的現實及廣泛應用,使數據量急劇增長。數據不斷的產生、計算、分析、應用、迭代……構成了一個真正意義上的網絡,我們已經深入到網絡空間中,成為自海、陸、空、天之後人類的第五大生存空間。

而在這個第五大生存空間中,數據扮演了重要的角色,成為網絡空間源源不斷地流淌的血液,成為了知識經濟的原材料更成為繼物質、能源之後又一種重要的生產要素和戰略資源。數據進一步變成了驅動現實的一種方式。

特別是隨著數字孿生技術的發展,我們通過這種方式可以進一步的描述現實,進而再來改變現實。從未來發展趨勢看,數據要素已成為重要的發展驅動。

我們國家高度重視新技術的發展,那麼如何在這一宏觀背景下將數據要素的價值真正釋放出來呢?

3.生產要素由市場評價貢獻、按貢獻決定報酬機制開始建立

如果放在更加宏觀的歷史背景來看,數據成為農耕社會後的重要的生產要素是人類進入信息化社會之後才形成的。我們回顧歷史看看生產要素的變更過程。

農耕社會主要的生產要素是土地、勞動力,在構造及生產發展的過程,要解決人類的生存,解決吃飯的問題,這是農耕文化發展的過程。

步入到工業社會,核心的生產要素是土地、勞動力、資本、技術、管理、知識。這時候是通過這種方式來促進工業化的革起,通過大規模化的生產,通過資本的力量來帶動土地、勞動力的有效流通,這為為現代化工業生產奠定良好的基礎。

第一方面的任務是推進政府數據資源的開放共享。這裡重點圍繞著經濟治理數據資源庫建設、數據共享交換以及數據開放流通制度這方面的工作開展,目的是要豐富數據資源體系,促進數據資源的有序開放共享和有效流動。

第二方面的任務是提升社會資源的價值,包括兩方面的工作內容:

  • 一是要圍繞著數字經濟的新產業、新業態、新模式來支撐構建農業、工業、交通、教育、安防、城市管理、公共數據交易等方面的數據資源開發利用場景,促進數據開發利用。

  • 二是要規範數據的採集行為。要發揮行業協會商會的作用,推動人工智能、可穿戴設備、車聯網、物聯網等相關領域的數據採集的標準化、規範化,使數據的質量不斷提升,使數據的內容不斷豐富。

第三方面的任務是加強數據資源的整合和安全保護,主要包括四方面工作內容:

  • 一是建立統一規範的數據管理制度,提升數據的規範性。

  • 二是根據數據性質完善數據產權性質,探索不同類別數據的差異化管理。

  • 三是製定數據隱私保護製度和數據安全的審查制度,形成一個數據安全保護製度體系。

  • 四是推動完善適用於大數據環境下的數據分類分級安全保護製度,通過分類分級來完善安全的保護製度,分類施策,對政務數據,企業商業機密和個人數據進行差異化的保護,加強對政務數據、企業商業秘密和個人數據的保護。

以上就是中央文件關於數據要素市場培育的主要內容。這又提出了一個新的話題,就是在這樣的一個構建數字要素市場過程中,我們必須對數據的特徵進行進一步的分析,要對差異化的數據開展治理。

數據治理的必要性

1.海量數據需要治理

海量數據的爆發增長使我們猶如進入了一個數字海洋,我們在數據的海洋中望洋興嘆,不知所踪。數據蘊含著豐富的價值,是當代的石油,當代的黃金。但是如果不能對數據進行有效管理和開發,數據並不可能產生真正的價值。如果沒有高效的管理和治理,數據價值就不可能產生,甚至有可能造成巨大的風險,有效的數據管理和治理是數字經濟發展的基礎。

2.海量的數據引發“數據危機”

同時我們看到,數據時代還面臨著數據危機的挑戰。海量的數據引發我們的對“數據危機”的思考。 “數據危機”這個概念是引用了上世紀六十年代所談到的軟件危機。軟件危機導致的最大的問題是軟件的開發模式無法適應快速增長的軟件需求,質量無法保證。我們對比來看,當今的數據也有軟件危機的表現形式。

一是數據壁壘森嚴。當前國際上普遍形成了一種各自本地化的要求,形成了一個數據壁壘。 2016年歐洲國際政治經濟中心(ECIPE)研究分析了強制數據本地化等數據保護措施對巴西、歐盟等7個國家和地區造成的負面經濟影響。

二是數據壟斷。 2018年3月,Facebook被爆出與英國諮詢公司劍橋分析違規分享超過5000萬用戶數據,在用戶不知情的情況下,上述數據被劍橋分析用於用戶心理剖析,並為其目標客戶投放針對性的政治競選廣告。

三是內部數據的洩露事件也頻發。實際上,很多洩露的內容大部分都是來源於內部管理的失效,大量的數據洩露的事件,對於我們的個人的隱私,乃至我們的金融安全,造成了很大的風險。

四是數據質量問題。海量的數據匯集完以後,數據的質量差、缺乏管理、數據不完備、無效性、冷數據、數據標準規範、數據、權威性不足,導致無法利用高質量的數據進行科學的決策,影響數據的高效應用,數據的茫茫大海,我們有迷失方向的威脅。

3.數據管理(治理)成為國際關注焦點

為此,各國都在將數據管理和治理看作重要的內容,這也成為全球關注的焦點。比如歐盟,發布了全球第一個最嚴格的數據法規——《通用數據保護條例》(GDPR);法國提出了“數據稅”的探索;美國聯邦政府將數據作為政府的聯邦戰略,以政府數據治理為主要視角,來提出了未來的聯邦政府的數據的願景和關鍵的行動計劃;2020年2月,歐盟也發布了《歐盟數據戰略》,以數字經濟發展為主要視角,推動構建歐洲單一數據市場,提升競爭力。

總的來說,數據管理成為未來全球各國競爭的焦點,成為各國的戰略聚焦點。數據治理,也成為國家治理的有效手段和重要組成部分。

4.我國積極推動大數據發展戰略實施

黨的十八大以來,以習近平同志為核心的黨中央高度重視發展數字經濟,推動數字經濟逐步上升為國家戰略。特別是在十九大報告中,提出了要推動互聯網大數據、人工智能與實體經濟的深度融合,進一步突出了大數據作為我國基礎戰略性資源的重要地位。

從目前分析來看,中國是全球數據增長最快的,擁有數據最多的國家。我們掌握了豐富的高質量的數據,如何將這些數據轉化成新的經濟增長的動力是我們經濟發展下一步的主要內容。對這樣海量的數據進行有效的管理是我們大家共同面臨的主要目標。

這裡的核心就是做到數據的有效的管理。我認為的數據如源源不斷的水,不斷滋潤著數字經濟的發展。中國人崇尚水文化,強調上善若水,水善利萬物而不爭。但是我們也看到,水可載舟,亦可覆舟,如果說不能對水進行有效的治理,就會導致水患。同樣的,數據也需要治理。加強數據治理,發揮數據價值成為搶占未來發展主動權的重要方向。

5.數據管理及治理的價值和意義

那麼這個從幾個方面來看數據治理和管理的價值。

第一,是組織機構數字資產保值增值的必然舉措。通過數據驅動來提高我們的運營效率,降低組織的投入成本,提升組織的管理過程。通過有效的組織管理來提升組織的資產價值,那麼我們必須要按照資產的方式,將數據進行管理。

第二,有助於引領行業的創新和規範化的發展。對數據進行有效的管理一方面可以進一步促進產業轉型升級,另一方面,數據管理也成為行業監管的有效手段,通過數據的有效管控對行業進行規劃。再之,通過數據有效治理和管理,能夠培養一批既懂產業,又懂數據的核心人才,讓這些人不斷地發展我國的數據產業。

第三,通過數據賦能治理體系和治理能力現代化。通過“數據多跑路,百姓少跑腿”,“用數據決策、用數據說話、用數據管理”來提升政府的治理水平和治理能力現代化。通過網絡通、數據通和業務通,來倒逼政府的內部的製度優化,助力政府、市場和社會關係的協調平衡。利用信息化的手段來提升政府的治理能力,通過數據的粘合提升行政管理效率,打造一個真正讓人民滿意的服務型政府。

工業數據管理意義

1. 國際視角:主要發達國家紛紛佈局工業數據搶占先機

從國際視角來看,我們面臨著製造業轉型升級的重要先機,各個發達國家都紛紛佈局工業數據先機。隨著雲計算、大數據和物聯網等新興產業的發展,全球掀起了以製造業轉型升級為主要任務的新一輪工業革命,各個發達國家紛紛制定再工業化的戰略。

法國在2013年提出了“新工業法國計劃”,主要就是實現工業生產向數字化、智能化的轉型,以生產工具的轉型升級帶動商業模式的轉型。

2015年由德國提出的工業4.0戰略,實施重點在於信息互聯技術與傳統工業製造的結合,強調通過CPS(信息物理系統)提升製造業的靈活性和工程效率,掀起了全球工業化改革的新一輪革命。美國也在2018年提出了《先進製造業領導力戰略》,提出“要通過大數據分析和先進傳感和控制技術應用於大量製造業活動,促進製造業的數字化轉型”。

2. 國家視角:我國由製造大國向製造強國轉變的關鍵舉措

我們國家已經成為全球重要的製造大國,當前中國製造業面臨產業“雙向轉移”的壓力。勞動密集型的中小製造企業正在向其他勞動力和資源更低廉的新興發展中國家轉移,部分高端製造業在向歐美髮達國家回流。

作為製造業大國,我們時刻產生著海量的工業數據,這成為我們國家國際競爭和國家安全的基礎要素,也是我們國家製造業轉型升級的戰略資源。如何做好數據大文章,是我們從“跟跑、並跑、到領跑”,實現“彎道取直、,“跨越發展”的關鍵要素支撐。

3.企業視角:推進企業數字化轉型的緊迫要求

從企業視角來看,工業數據是製造業實現從傳統要素驅動向數字要素驅動的核心關鍵。

一是優化全要素配置效率。通過全產業鏈供需數據來進一步優化要素的配置效率,優化配置生產所需的原材料,設備,勞動力,資金等,可以實現農業生產,調度,分配,全局優化,促進工業全要素生產率的全面提升。

二是改進生產過程的質量保證。通過建立包括產品生產過程的工藝數據、,在線監測數據等全生命週期的質量數據體系,可以有效的追踪數據質量問題產生的原因,持續增強生產過程的質量保障能力。

三是可以促進生產流程的智能化。通過對設備和工廠進行智能化升級,促進數據共享系統和業務的協同,實現製造過程中的科學決策,進一步促進生產過程的智能化、定制化、柔性化、自我優化,實現真正意義上的精準製造、高端製造、敏捷製造能力。

工業數據的聚合融通離不開數據的有效管理,更需要數據的安全使用。工業數據作為全新的生產要素,在管理執行,開發利用,流通共享等方面存在的問題困難是我們需要進一步加以研究和分析的。

02 工業數據分類分級情況介紹

工業如何加強企業數據管理能力?方法路徑有很多。而我們認為開展數據分類分級,則是落實國家要求,提升製造業企業數據管理的重要舉措。 《大數據產業發展規劃(2016-2020年)》將數據資源分類標識作為數據管理要點。 《工業控制系統信息安全防護指南》提出對數據進行分級分類管理。

2018年出台的《數據管理能力成熟度評估模型》(DCMM)明確將數據分類分級作為數據管理能力第2級(受管理級)至第5級(優化級)的基本要求。企業如何做好自身數據分類分級,提升數據管理能力?這就亟需有關部門製定文件,指導企業開展數據分類分級工作。

工業數據分類分級是企業提升數據管理能力的基本功,是實現企業數據差異化,安全防護管理的基本前提,是企業數據價值釋放、共享流通,開發利用的必由之路。

但企業該如何做好自身數據分類分級,提升數據管理能力?這就亟需有關部門製定文件,指導企業開展數據分類分級工作。

在此背景下,今年3月份,工信部專門發布《工業數據分類分級指南(試行)》(以下簡稱《指南》),旨在指導企業全面梳理自身工業數據,提升數據分級管理能力,促進數據充分使用、全局流動和有序共享。 。下面圍繞這個指南的內容和大家做一個分享。

《指南》解讀

1.《指南》基本內容

《指南》對工業數據分類分級提出了部署要求。指南分4章,共16條。指南總則部分是原則和目標,第二章圍繞著數據分類有三條,第三章圍繞著數據分級有四條,第五章圍繞著分級管理有五條,《指南》以提升工業企業的數據管理能力為目標。

《指南》提出,開展數據分類分級堅持三個結合原則。一是以問題導向、目標導向和結果導向相結合。二是企業為主體,行業為指導,屬地監管相結合原則,三是分類標識,逐級定級,分級管理相結合原則。

2.數據分類分級目的及意義

通過研讀《指南》內容,可以看出,數據分類治理是實現不同企業之間數據共享互認的基本功。我們通過分類標識過程,將分散的、存儲在不同系統的數據內容,進行有效匹配、互認,講工業數據管理由原來的“雜貨舖”變成一個“自動化倉庫”,實現工業數據的共享流通。

工業數據的分級治理是確保數據安全的基準線。隨著越來越多的設備系統生產和服務暴露在互聯網中,數據安全的風險越來越大。為此,我們一定要站在安全的視角上進行分級,結合工業數據的屬性、安全的防護要求,構建數據分級管理的製度體系,分級施策,確保工業數據的安全。

工業數據多方治理是理清各方職責的指示燈。工業數據分佈在不同的部門,涉及的主體眾多,參與職責現在目前不清楚,各企業也沒有建立一個有效的推進機制。為此,我們必須要以治理的方式為重點協調各方,有效的推動工業數據的分類,明確各個治理主體的分工,理清各方的職責權限,從而建立有效的管理機制來保證工業數據的分類分級持續開展。

工業數據分類分級工作的核心目的就是要提升製造業企業的數據管理,進而促進加快數據要素市場培育。一要實現對企業系統數據進行全面的盤點和分類梳理。二要實現對數據的分類分級的管理。三進而打破數據的孤島,實現數據在行業內、在企業內的有效的共享和深度開發利用。

工業數據分類分級試點工作內容

1.試點工作目標及原則

在試點過程中,我們主要核心工作就是要將我們的工業數據分類分級的指南推向深入,讓企業結合各自的特點開展工作。自3月份以來,雖受疫情的影響,但工信部還是組織開展了工業數據分類分級的利用試點工作。試點的目標就是按照工業數據分類分級的要求推動相關應用試點企業完成數據底賬,進而提升工業數據的管理能力。

實際上就是指在實踐過程中,要堅持問題導向、目標導向。要以解決問題為指引,集中試點企業的全部力量和有效的資源,攻堅克難,全面的探索工業數據分類分級所存在的問題和矛盾。以目標為導向,就是為了提高企業數據管理的能力,持之以恆一步一個腳印的朝著目標奮鬥。堅持問題為導向,堅持把企業的數據底賬摸清。

2.工作主體

數據分類分級試點工作主體包括三類:核心主體是企業,賽迪這樣的第三方機構作為支撐機構全程引導企業開展試點工作;而行業協會和政府則起到監督指導作用,逐步實現”企業點突破、行業線貫通、地方面推廣”的的工業數據分類分級管理體系,提升數據管理和安全防護能力。

3.三項重點工作

那麼核心就是要抓住三個重點:

一是分類標識要全。要對工業企業的全量數據進行全面的梳理進行分類標識,做全面的梳理盤點,將企業內部的數據作為資產一樣進行管理。像垃圾分類一樣,將各類數據分門別類,有效的管理起來。

二是要逐類的定級,定級要準。按照數據的受損情況進行定級,來保證數據的有效性。數據分級站在數據的安全的受損的視角上進行,分類定級不是目的,目的是要進行分級的管理,要保證數據的安全,保證企業的數據價值的有效釋放。這就要求我們差異化分類施策。

三是分級管理要細緻到位。這樣形成一個有效的閉環,把數據作為一個有效的過程來去做,通過試點積累的工作經驗,提煉經驗做法成為我們的方法論,培育行業標杆,通過他們現身說法,來進一步解釋數據價值釋放過程。

工業數據分類分級試點推進情況

賽迪研究院在這一過程中積極配合工信部和相關的行業協會,做好相關的配合工作開展了一系列相關的培訓和調研工作,不斷地完善相關的模板,來提升相關的內容。

這個過程中,我們跟相關的領導依次走訪了建築建材、酒業協會、紡織協會、工程機械協會等了解相關情況、探索相關的規律,通過這種方式促進企業數據分類分級試點工作開展。

03 工業數據分類分級推進路徑

對於企業內部來說,如何來開展數據的分類分級?這就要進一步學習領會3月份發布的工業數據分類分級的指南試行版的內容。

理順工作思路

一方面,要理清工作思路,首先要明確三級分類的範圍。另一方面,要從數據產生系統和業務出發,將業務的框架、邏輯、表現過程,按業務、系統、模塊等不同的衡量進行分類。三就是要從業務和系統看數據的分佈情況,要明確數據在哪裡、數據由誰提供、數據的格式是什麼等等這方面問題。

定級就是要對數據的安全性,對每類數據進行級別的劃分,然後進行差異化的防護。理清工作思路就能清楚如何開展數據分類分級工作。

明確數據類別分類

明確數據類別分類也是很多企業困擾一個問題。

我認為,可以從兩方面入手。一方面是站在組織架構和核心業務的視角來分析數據,就是按照部門業務、數據內容,對企業數據進行全面的梳理,這樣是站在業務側來去看數據系統化、規範化的管理程度。

另一個可以從數據從哪裡來入手。基於“企業業務—支撐業務的系統功能—對應數據庫和數據表”進行分類。大部分數據都來源於信息系統,我們可以站在業務——支撐各個業務系統的系統功能上,對現有的數據庫、數據表進行分類。大部分的企業可以通過先梳理現有的業務系統,如ERP、MES系統,按照《指南》的五個數據域進行分類,然後根據功能模塊對應的數據庫和數據表今後一步劃分數據子類。

這兩方面是殊途同歸的。一個是站在業務視角上考慮問題,一個是從技術視角上考慮問題,相互促進。

做好工作保障

數據分類分級的各項工作絕不僅僅是IT部門的事情,它是一個治理的過程,必須要形成一個良好的綜合協調機制,要以業務視角和技術視角相融合的方式來開展,這樣才能使工作推向深入。

另一方面,要實現數據分類分級全覆蓋,要按照工序,業務流程,功能等思考數據分類分級。同時,要細緻準確的做好數據的逐類定級,要把數據的受損情況降低到最低,然後來評價每項數據的保護措施是否到位,這樣才能夠形成一個閉環。最後,要在現有的基礎上,站在數據的維度上進行管理,進一步梳理數據,形成一個有機的管理體系。

尋求第三方支撐

這裡實際上要如何做好呢?很多企業還不會做的話可以尋找第三方的支持。第三方機構的支撐工作內容包括開展深入的調研,充分收集相關的信息;評估調研的結果,找到癥結所在;組織內部的培訓,加大方法的宣傳;編制相關的指導文件,構建相關的管理體系;指導結果的審核,做好評定的準備;監控諮詢的質量,提高優質的服務,這樣才能夠保證這項工作得到有效進行。

最後,我們也希望大家,在這個後面的過程中能夠進一步的圍繞著數據的理論性問題進行探討,尋找“數”之道理,圍繞著數據治理、數據流通、數據安全、數據屬性、數據倫理等這些理論性問題開展研究;探索數據之道路,圍繞著數據的應用問題,例如數字經濟、數字化轉型、數字政府、智慧城市等內容,開展相關的內容研究;尋覓數據之道法,實際上是在技術上要解決數字孿生,數據中台,數字新基建等方面問題,通過技術側來支撐理論和應用的落地,來保證數據價值的實現。

今晚跟大家交流,也希望在座的各位企業家們能夠重視工業數據的分類分級,早做比晚做好,數據治理是一個長期的過程,需要一把手重視,全員參與,共同促進這項工作不斷發展。

我認為數據治理是一個有起點,沒有終點的過程,是必須要堅持,久久為功常抓不懈才能走向深入。

(本文來自數據質量管理智庫)

展開全文打開碳鏈價值APP 查看更多精彩資訊

Total
0
Shares
Related Posts