• 熱門搜索
    搜索歷史
    清空歷史
APP推廣合作
聯系“鳥哥筆記小喬”
數據資產目錄建設之數據分類全解(下)
2022-05-09 10:26:42

作者:彭文華

先分類還是先分級?

一般來說,數據分類、分級會在兩個領域出現,一個是數據資產目錄建設,一個是數據安全管控。

數據資產目錄這邊偏分類多一些,因為數據資產太多了,需要歸歸堆,沒有一個樹形的目錄體系,根本沒辦法查找。

當然,樹形目錄的弊端也很多,比如查找困難等。所以現在又出現了多分類、標簽等方法,輔助進行數據資源的檢索。

數據安全管控的方式一般是針對不同級別的數據,施行對應的管控手段,限制人數、可訪問范圍,所以安全這邊主要是數據的分級。

比如《工業數據分類分級指南(試行)》把數據分為一、二、三級,也就是一般、重要、核心數據?!痘A電信企業數據分類分級方法》中按重要敏感程度,把數據分為第四級、第三級、第二級、第一級,大概意思就是高敏感、敏感、不敏感、公開。

所以,分類和分級,是兩個工作。根據其目的,側重點不一樣,先做那個,取決于當前主推那個任務。

從老彭參與的項目上來看,一般來說,先做數據盤點,整理數據資產目錄的較多。也就是先進行數據分類的情況較多。

數據分類案例

上篇講到,數據分類主要有線分類法、面分類法和混合分類法三種。但是線分法和面分法都有其局限性,所以我們常見的數據分類,還是采用折中的混合分類法較多。

同時,數據分類跟行業屬性、業務也有非常大的關系。

以政務數據分類為例,《貴州省政務數據分類分級指南》中建議政務數據可以采用主題分類、行業分類和服務分類三種分類方法。

本標準采用多維度和線分類法相結合的方法,在主題、行業和服務三個維度對貴州省政府數據進行 分類,對于每個維度采用線分類法將其分為大類、中類和小類三級。業務部門可以根據業務需要,對數據分類進行小類之后的細分。對小類的細分,各部門可以根據業務數據的性質、功能、技術手段等一系 列問題進行擴展細分。本標準采用面分類法將政府數據按照多個維度進行關鍵詞的標簽構造。

按主題分類的方法,可將貴州省政府數據分為以下大類:綜合政務、經濟管理、國土資源、能源、工業、交通、郵政、信息產業、城鄉建設、環境保護、農業、水利、財政、商業、貿易、旅游、服務業、氣象、水文、測繪、地震、對外事務、政法、監察、科技、教育、文化、衛生、體育、軍事、國防、勞動、人事、民政、社區、文秘、行政、綜合黨團。

按行業分類的方法,則將貴州省政府數據分為以下大類:農、林、牧、漁業;采礦業;制造業;電力、熱力、燃氣及水生產和供應業;建筑業;批發和零售業;交通運輸、倉儲和郵政業;住宿和餐飲業;信息傳輸、軟件和信息技術服務業;金融業;房地產業;租賃和商務服務業;科學研究和技術服務業;水利、環境和公共設施管理業;居民服務、修理和其他服務業;教育;衛生和社會工作;文化、體育和娛樂業;公共管理、社會保障和社會組織;國際組織。

以電信數據分類為例,《基礎電信數據分類分級方法》中主要采用線分類的方法,對電信數據進行完整的分類。

根據基礎電信企業業務運營特點和企業內部管理方法,收集企業內所有部門的數據資源,梳理所有數據資源。按照線分類法,按照業務屬性(或特征),將基礎電信企業數據分為若干數據大類,然后按照大類內部的數據隸屬邏輯關系,將每個大類的數據分為若干層級,每個層級分為若干子類,同一分支的同層級子類之間構成并列關系,不同層級子類之間構成隸屬關系。所有數據類及數據子類構成數據資源目錄樹,如圖1所示。目錄樹的所有葉子節點是最小數據類。最小數據類是指屬性(或特征)相同或?相似的一組數據。

數據資產目錄建設之數據分類全解(下)

電信的數據分類如下:

用戶相關數據:

1.用戶身份相關數據(用戶身份相關數據、用戶網絡身份相關數據)

2.用戶服務內容數據

3.用戶服務衍生數據(用戶服務使用數據、設備信息)

4.用戶統計分析類數據(用戶使用習慣和行為分析數據、用戶上網行為相關統計分析數據)

企業自身相關數據:

1.網絡與系統的建設與運行維護類數據(建設類數據、網絡與系統資源類數據、網絡與系統運維類數據、網絡安全管理類)

2.業務運營類數據(業務運營服務數據、公開業務運營服務數據)

3.企業管理數據(發展戰略與重大決策、業務發展、技術研發類、運行管理類、生產經營類、綜合管理類)

4.其他數據(合作方提供數據)

以證券數據分類為例,《證券期貨數據分類分級指引》中主要采用線分類的方法,按照業務條線,對證券數據進行完整的分類。

證券的數據分類如下:(以數據匯集型會管單位數據分類為例)

1.交易(交易管理、結算管理、行情管理、發行管理、會員管理/機構管理、投資者管理、產品管理)

2.監管(監察與評價管理、研究報告、信息披露管理)

3.其他(標準化管理、業務管理、技術管理、綜合管理)

數據分類方法論

其實上篇已經把數據分類的基本方法論說過一遍了。有些彭友覺得不太解渴。今天我們就好好學習一下《證券期貨數據分類分級指引》中的內容??蓞⒖夹赃€是很大的。首先放一張體系圖:

數據資產目錄建設之數據分類全解(下)

這張圖上篇已經講過了,這里就不復述一遍了?!吨敢防镞€給出了具體的分類分級的流程:

數據資產目錄建設之數據分類全解(下)

參考上面的圖,《指引》中把數據分類分為兩個階段,即業務細分階段和數據歸類階段,每個階段細分不同的步驟。

在業務細分階段,參考他們提出的MS-MS方法(管理主體-管理范圍),將業務進行細分。

數據資產目錄建設之數據分類全解(下)

管理主體就是“WHO”,管理范圍就是“WHERE”,這兩個對象一確定,就說清楚了是“誰”具體負責“哪里”的事情,職責范圍就清晰了,業務條線自然而然就劃分出來了。

業務細分一共分為四個步驟:

步驟一:確定業務一級子類——基本業務條線。參考《證券期貨行業數據模型》確定的業務條線作為基礎。對!數據分類和模型是緊密關聯的?。?!

步驟二:確定每個業務條線下所有的業務管理主體(MS)。

步驟三:確定每個業務管理主體對應的管理范圍,明確對應關系(MS-MS)

步驟四:命名映射關系——業務二級子類。

此方法可以在每一層都這么用,無限套娃,理論上可以把所有的業務細分到足夠細的顆粒度,直到每個人。

但是我們分類的時候一般就分個3、4級就行了,在《指引》里,建議用MS-MS劃分一次就行,剩下的層級放在數據歸類階段進行。

在數據歸類階段,參考他們提出的MS-MO(管理范圍、管理對象)方法,對數據進行歸類。

數據資產目錄建設之數據分類全解(下)

MS-MO方法其實也很好理解。管理范圍就是延續上面“MS-MS”后面的MS。匯總起來就是MS-MS-MO,就是管理主體(WHO)、管理范圍”WHERE“、管理對象”WHAT',即誰,在哪些業務范圍,具體管理那些數據。

數據歸類總共也分為四步:

步驟一:明確各個業務二級子類的管理范圍(MS)。

步驟二:確定業務二級子類的管理范圍對應的管理對象(MS-MO),即找到業務二級子類下的全部數據。

步驟三:按照數據細分方法對各個“單類業務數據總和”分別細分,得到數據一級子類。

數據資產目錄建設之數據分類全解(下)

步驟四:命名數據一級子類。

然后,就是對已劃分明確的數據一級子類進一步細分,細分后產生一個或者多個數據子集:

數據資產目錄建設之數據分類全解(下)

經過上面的兩大階段,8個小步驟,就能得到一個完整的數據分類目錄:

數據資產目錄建設之數據分類全解(下)

數據資產目錄建設之數據分類全解(下)

小結

數據分類真的很復雜,絕對不是簡簡單單拖出來一個腦圖就能解決問題的。

其中最麻煩的地方,是對業務的深刻理解,以及各自管理范圍和管理對象的梳理。這時候最容易陷入到企業組織本身的缺陷當中。

比如A部門和B部門的職責不清晰,管理范圍有交叉、對同一個管理對象都有管理權力,這時候我們就無法劃分清楚數據的Owner,也無法確定某個指標的具體負責人到底是誰。

我們就是個搞數據的,最后卻要陷入到企業管理本身的紛爭中去,這才是最頭疼、最惱火的事情。

唉...數據只能解決數據的問題,解決不了管理的問題。就醬。

大數據架構師
分享到朋友圈
收藏
收藏
評分
評論

綜合評分:

我的評分

參與評論(0)

社區交流公約

暫無評論,快來搶沙發吧~
登錄后參與評論
發布評論
鳥哥筆記用戶社區交流公約

Xinstall 15天會員特權
Xinstall是專業的數據分析服務商,幫企業追蹤渠道安裝來源、裂變拉新統計、廣告流量指導等,廣泛應用于廣告效果統計、APP地推與CPS/CPA歸屬統計等方面。
20羽毛
立即兌換
超級nice便簽磚
超級超級超級奈斯!
1000羽毛
立即兌換
【新品】辦公/外出兩用靜音充電小電扇
辦公桌必備小電扇!
2000羽毛
立即兌換
大數據架構師
大數據架構師
發表文章261
歷任多家公司大數據總監、大數據架構師,專注于數字化轉型領域。
確認要消耗 羽毛購買
數據資產目錄建設之數據分類全解(下)嗎?
考慮一下
很遺憾,羽毛不足
我知道了

我們致力于提供一個高質量內容的交流平臺。為落實國家互聯網信息辦公室“依法管網、依法辦網、依法上網”的要求,為完善跟帖評論自律管理,為了保護用戶創造的內容、維護開放、真實、專業的平臺氛圍,我們團隊將依據本公約中的條款對注冊用戶和發布在本平臺的內容進行管理。平臺鼓勵用戶創作、發布優質內容,同時也將采取必要措施管理違法、侵權或有其他不良影響的網絡信息。


一、根據《網絡信息內容生態治理規定》《中華人民共和國未成年人保護法》等法律法規,對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規的信息,主要表現為:
    1)反對憲法所確定的基本原則;
    2)危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統一,損害國家榮譽和利益;
    3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
    4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
    5)煽動民族仇恨、民族歧視,破壞民族團結;
    6)破壞國家宗教政策,宣揚邪教和封建迷信;
    7)散布謠言,擾亂社會秩序,破壞社會穩定;
    8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
    9)煽動非法集會、結社、游行、示威、聚眾擾亂社會秩序;
    10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權益;
    11)通過網絡以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網絡欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法規禁止的其他內容;


2. 不友善:不尊重用戶及其所貢獻內容的信息或行為。主要表現為:
    1)輕蔑:貶低、輕視他人及其勞動成果;
    2)誹謗:捏造、散布虛假事實,損害他人名譽;
    3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
    4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
    5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
    6)謾罵:以不文明的語言對他人進行負面評價;
    7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
    8)威脅:許諾以不良的后果來迫使他人服從自己的意志;


3. 發布垃圾廣告信息:以推廣曝光為目的,發布影響用戶體驗、擾亂本網站秩序的內容,或進行相關行為。主要表現為:
    1)多次發布包含售賣產品、提供服務、宣傳推廣內容的垃圾廣告。包括但不限于以下幾種形式:
    2)單個帳號多次發布包含垃圾廣告的內容;
    3)多個廣告帳號互相配合發布、傳播包含垃圾廣告的內容;
    4)多次發布包含欺騙性外鏈的內容,如未注明的淘寶客鏈接、跳轉網站等,誘騙用戶點擊鏈接
    5)發布大量包含推廣鏈接、產品、品牌等內容獲取搜索引擎中的不正當曝光;
    6)購買或出售帳號之間虛假地互動,發布干擾網站秩序的推廣內容及相關交易。
    7)發布包含欺騙性的惡意營銷內容,如通過偽造經歷、冒充他人等方式進行惡意營銷;
    8)使用特殊符號、圖片等方式規避垃圾廣告內容審核的廣告內容。


4. 色情低俗信息,主要表現為:
    1)包含自己或他人性經驗的細節描述或露骨的感受描述;
    2)涉及色情段子、兩性笑話的低俗內容;
    3)配圖、頭圖中包含庸俗或挑逗性圖片的內容;
    4)帶有性暗示、性挑逗等易使人產生性聯想;
    5)展現血腥、驚悚、殘忍等致人身心不適;
    6)炒作緋聞、丑聞、劣跡等;
    7)宣揚低俗、庸俗、媚俗內容。


5. 不實信息,主要表現為:
    1)可能存在事實性錯誤或者造謠等內容;
    2)存在事實夸大、偽造虛假經歷等誤導他人的內容;
    3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構或個人存在關聯。


6. 傳播封建迷信,主要表現為:
    1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
    2)求推薦算命看相大師;
    3)針對具體風水等問題進行求助或咨詢;
    4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;


7. 文章標題黨,主要表現為:
    1)以各種夸張、獵奇、不合常理的表現手法等行為來誘導用戶;
    2)內容與標題之間存在嚴重不實或者原意扭曲;
    3)使用夸張標題,內容與標題嚴重不符的。


8.「飯圈」亂象行為,主要表現為:
    1)誘導未成年人應援集資、高額消費、投票打榜
    2)粉絲互撕謾罵、拉踩引戰、造謠攻擊、人肉搜索、侵犯隱私
    3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
    4)以號召粉絲、雇用網絡水軍、「養號」形式刷量控評等行為
    5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序


9. 其他危害行為或內容,主要表現為:
    1)可能引發未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
    2)不當評述自然災害、重大事故等災難的;
    3)美化、粉飾侵略戰爭行為的;
    4)法律、行政法規禁止,或可能對網絡生態造成不良影響的其他內容。


二、違規處罰
本網站通過主動發現和接受用戶舉報兩種方式收集違規行為信息。所有有意的降低內容質量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發布違規內容時,本網站將依據相關用戶違規情節嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發布違規內容時,本網站將加重處罰。


三、申訴
隨著平臺管理經驗的不斷豐富,本網站出于維護本網站氛圍和秩序的目的,將不斷完善本公約。
如果本網站用戶對本網站基于本公約規定做出的處理有異議,可以通過「建議反饋」功能向本網站進行反饋。
(規則的最終解釋權歸屬本網站所有)

我知道了
恭喜你~答對了
+5羽毛
下一次認真讀哦
成功推薦給其他人
+ 10羽毛
評論成功且進入審核!審核通過后,您將獲得10羽毛的獎勵。分享本文章給好友閱讀最高再得15羽毛~
(羽毛可至 "羽毛精選" 兌換禮品)
好友微信掃一掃
復制鏈接
野花香在线观看视频_国产成人影院全部在线观看_永久免费黄色软件_2012韩国高清完整版播放