我已經說過很多次了:在那些與數據管理作鬥爭的組織中,現有的功能常常隱含地承擔數據責任(例如,在這篇文章中)。通常,這要么是技術功能,要么是分析功能,它們只是不情願地接受它。
我的意思是“組織”相當鬆散。從根本上說,這甚至適用於整個信息服務行業; 這個想法還是一樣的。此外,像往常一樣,我的意思是“分析”廣義上包括應用統計、數據科學、商業智能、機器學習、人工智能、商業分析等。
那麼,這種責任錯位究竟是如何發生的呢?
場景一:技術功能承擔數據責任
總是,這僅僅是因為他們是保管人。顯然,他們負責生成和/或存儲數據的技術。因此,內容默認成為他們的責任。然而,他們的官方職位描述中通常沒有明確的數據內容。
有一點幾乎總是在周圍迷失。數據的技術視角不同於數據的數據用戶視角。這與技術熟練程度無關; 它甚至適用於最先進的數據科學開發人員。
相反,它與技術功能的目的有關。它的重點是數據存在和移動的環境和平台、用於處理數據的工具、避免技術錯誤的規則和邏輯——而不是數據內容。當所有規則都得到滿足並且沒有錯誤時,技術人員多久查看一次數據?
問題是這些規則無法解決所有標準數據質量維度。他們無法解決諸如“數據是否合理反映現實?”之類的問題。你只能通過查看數據內容來做到這一點。技術人員在其真正職責範圍內有太多任務,不能通過查看數據內容來偏離軌道。
場景2:分析功能承擔數據責任
分析從業者通常會默認承擔數據的責任。在絕大多數情況下,這似乎是自然而合乎邏輯的結果。畢竟,他們確實更接近數據內容,通常比組織中的任何其他人都更接近。他們擁有必要的硬技能。
這只是對以下事實的誤用:仔細查看數據內容是良好數據分析的必要先決條件。我已經在其他地方說過,他們不是精通所有行業實踐的數據管理專業人員。但與分析主導的數據管理的主要差距在於,你永遠不知道你的下一個數據問題將是什麼。
對於分析從業者來說,數據質量是達到目的的一種手段。他們只有在獲取用於特定分析的數據時才會遇到數據質量問題,從而使數據管理完全被動。這些是你碰巧遇到的數據問題。
典型的數據分析工作只能看到整個可用數據的非常非常小的一部分,這並非微不足道。你甚至不知道還有哪些其他風險?對於每一個數據問題,人們都會對你的數據失去信任,而失去對數據的信任很難重新獲得。在最壞的情況下,這些風險之一會導致災難性的事情發生,到那時為時已晚。無知不是福。
缺乏適當的數據所有權= 沒有做任何重要的事情
必須有人最終對某處的所有數據負責——而不僅僅是負責。當沒有人負責時,沒有什麼重要的事情可以完成; 當多人“負責”時,沒有什麼重要的事情會以同樣的方式完成。
正如我所提到的,數據的技術視角不同於數據用戶的視角。因此,技術角度的數據文檔不同於數據用戶角度的數據文檔。這種區別很像製造商有關其汽車的內部文檔和用戶手冊之間的區別。
最終數據所有者的工作是照顧數據生產者和數據使用者的利益。我遇到過很多組織,他們的系統文檔非常好,但沒有任何數據用戶文檔。為什麼這很重要?前者可能會記錄人們期望在數據中看到的內容,但後者會記錄人們在數據中實際看到的內容。
至少根據我的經驗,完全沒有任何文檔的情況非常罕見。在實踐中,最壞的情況是任何類型、系統或其他方面的文檔都不完整。更常見的是,存在文檔但不為數據用戶受眾提供,讓用戶瀏覽系統文檔。或者數據用戶文檔存在,但沒有人知道在哪裡。正如我之前提到的,查找數據文檔的困難是數據管理問題的明顯跡象。這些問題不僅僅是分析或技術——它們是整個組織層面的問題。
“但我們沒有數據”
你的組織可能會從第三方獲取你的大部分數據,或者與其他組織有聯合數據安排。你仍然不能倖免——有數據需要管理,直到它死去甚至更久。你採用它或分享它的監護權並不意味著你不餵養、培育和照顧它。
你可能認為你的組織不產生數據。這在今天是非常不可能的——即使我作為獨立顧問生成專有數據。事實上,我想不出一個組織根本不產生數據的情況。
請記住,數據不一定是數字的。在當今推動數字化的過程中,這是一個經常被忽視的事實。
我們從這裡去哪裡?
每次我與一群技術和/或分析從業者討論這個問題時,他們的反應都是如釋重負。他們一直在受苦,最後,這一切第一次變得有意義。
那麼,我們如何解決這個問題呢?非數據管理人員的責任是什麼?
首先,如果不存在,則提倡建立適當的數據功能。與領導層和人力資源部合作。首先定義所有數據的最終所有者。你需要一個專門的或至少一個無可爭議的指定角色來負責管理數據。然後,保護該角色免受其他更實際甚至更性感的事情的影響。
這並不意味著我們可以免除任何數據責任。作為利益相關者,從長遠來看,我們可能不需要承擔責任。但我們都有責任為數據的健康做出貢獻。我們也有責任為更大的數據利益做正確的事情。培養一個數據孩子確實需要一個村莊。
因此,請認真對待你看到的數據。具體來說:
如果你是技術從業者:盡可能多地從用戶的角度了解數據內容以及它與現實的關係。不要假設現實遵循意圖,尤其是在數據方面。如果你是分析從業者:收到每個項目數據後立即對其進行審核。不要等到一路上遇到問題。記錄並傳達結果。你所做的每個項目數據審計都成為數據質量的部分文檔。並學習分析項目數據審計方法。 * 如果你是信息消費者,即業務領導者:抵制將數據責任分配給技術或分析功能的誘惑。
認真對待“數據驅動”(無論這意味著什麼)?數據值得承擔的責任不只半途而廢。我總能在一英里外發現口頭服務
PS 我不時為分析從業者舉辦數據審計方法研討會。在社交媒體上關注我或在此處註冊以獲取電子郵件更新。
資訊來源:由0x資訊編譯自DATADRIVENINVESTOR,版權歸作者Michiko Wolcott所有,未經許可,不得轉載