本文將為您介紹如何在手動修正數據頁面,對規則識別不準確的數據進行手動修正。
手動修正的數據結果,在第2天才會生效展示。
背景信息
DataWorks支持您對數據識別規則識別不準確的敏感數據進行手動修正,手動修正數據的使用邏輯如下圖所示。
手動修正數據
進入數據識別規則。詳情請參見:進入數據識別規則。
單擊手動修正數據頁簽,進入手動修正數據頁面。
手動修正識別結果不準確的數據。
操作
描述
篩選
在上圖的區域①,您可以通過篩選條件過濾需要查詢的識別結果。
你可以根據引擎類型、項目空間名稱、表名、字段名等條件進行篩選,還支持您單擊高級篩選,展開更多篩選條件,您可以進一步通過分類、分級、敏感狀態等條件進行篩選。
分類:當前租戶默認分類分級模板中的分類信息。詳情請參見:配置敏感數據分類分級
分級:當前租戶默認分類分級模板中的分級信息。
敏感狀態:包括敏感字段和非敏感字段。非敏感字段為您過濾已手動修改為非敏感字段的數據。
說明目前支持對ODPS、EMR、CDH、HOLO引擎中的敏感字段識別結果進行修正。
修正單個數據
在上圖的區域②為您展示識別結果列表,您可以單擊顯示字段設置勾選您需要關注的字段信息,刷新識別結果列表詳情。列表默認為您展示項目空間、表名稱、字段名稱、敏感字段類型,同時,您還可以單擊操作列的血緣關系進入查看敏感數據血緣(公測)模塊查看字段級別的數據血緣關系。
對于敏感字段類型識別結果有誤的字段,單擊右側敏感字段類型列的下拉框,列表中為您展示當前租戶下默認分類分級模板中已發布的敏感字段類型。您可以查看已有的敏感字段類型是否滿足需求:
滿足需求:則選擇其他已有敏感字段類型,并單擊右側的圖標進入數據識別規則頁面修改原敏感字段類型對應的識別規則和修改后的敏感字段類型對應的識別規則,以保證后續識別的準確性。
不滿足需求:您可以單擊右側的圖標進入數據識別規則頁面,或滑動至下拉框底部,單擊管理敏感字段類型,默認跳轉至數據識別規則頁面并打開新建敏感字段類型彈窗,新增敏感字段類型,并配置識別規則。詳情請參見:配置數據識別規則。
批量修正數據
選中需要批量修正的字段,單擊上圖區域③的批量修正按鈕,彈出批量修正識別結果對話框,敏感字段類型下拉框列表中為您展示當前租戶下默認分類分級模板中已發布的敏感字段類型,你可以選擇正確的敏感字段類型,單擊保存,完成批量修正識別結果的操作。
管理識別結果
對于系統未識別到的數據,您可以單擊右上角的新增識別結果手動添加識別結果,同時支持您單擊導出識別結果導出篩選條件下的識別結果至本地。
新增識別結果:在彈出的對話框中選擇要新增的字段所在的引擎,并輸入格式為project.table.column的字段GUID后,選擇該字段對應的敏感字段類型(當前租戶默認分類分級模板中已發布的敏感字段類型),單擊確定,完成識別結果的導入。
導出識別結果:單擊導出識別結果自動為您導出當前篩選條件下的識別結果。
說明最多支持導出10萬條數據。