數據脫敏可以對實時同步的單表數據進行脫敏,然后存儲到指定的數據庫位置。
前提條件
配置數據脫敏節點前,您需要先配置好相應的輸入節點,詳情請參見實時同步支持的數據源。
操作步驟
進入數據開發頁面。
登錄DataWorks控制臺。
在左側導航欄,單擊工作空間列表。
選擇工作空間所在地域后,單擊相應工作空間后的 。
鼠標懸停至圖標,單擊 。
您也可以展開業務流程,右鍵單擊目標業務流程,選擇
。在新建節點對話框中,選擇同步方式為單表(Topic)到單表(Topic)ETL,輸入名稱,并選擇路徑。
重要節點名稱必須是大小寫字母、中文、數字、下劃線(_)以及英文句號(.),且不能超過128個字符。
單擊確認。
在實時同步節點的編輯頁面,鼠標單擊 并拖拽至編輯面板,連線已配置好的輸入節點。
單擊數據脫敏節點,在數據脫敏對話框中,配置各項參數。
新建脫敏規則:單擊新建脫敏規則,在彈出來的新建脫敏規則對話框中選擇需要設置的敏感數據類型、脫敏規則名稱、脫敏方式、安全域和替換字符集。
新建脫敏規則
配置基礎信息
參數
描述
敏感數據類型
默認為選擇已有,右側下拉框選擇已創建的敏感數據類型(包括內置和所有用戶創建的敏感數據類型)。
可切換新增類型,右側輸入框可輸入敏感數據類型名稱(輸入字符限制1~30字,包括:中文、英文、數字)。
用戶輸入新增敏感數據類型,系統會判斷文字與已有敏感數據類型名稱是否相同(包括:內置和該租戶下所有用戶配置的敏感數據類型),如果名稱相同則提示敏感字段類型重復。
說明內置敏感數據類型:手機號、身份證號、銀行卡號、郵箱_內置、IP、車牌號、 郵政編碼、座機號、MAC地址、地址、姓名、公司名、民族、星座、性別、國籍。
脫敏規則名稱
該文本框會自動代入用戶填寫的敏感數據類型(輸入字符限制1~30字,包括:中文、英文、數字),您也可以修改名稱,當與該租戶下所有用戶創建的脫敏規則出現重名時,提示規則名稱重復。
配置脫敏方式與規則:DataWorks支持的脫敏方式包括假名、哈希和掩蓋三種方式。
假名
假名脫敏會將一個值替換成一個具有相同特征的脫敏信息。脫敏后數據和脫敏前數據的格式保持一致。
當選擇的敏感數據類型為內置敏感數據類型(手機號、身份證號、銀行卡號、郵箱_內置、IP、車牌號、 郵政編碼、座機號、MAC地址、地址、姓名、公司名)時,用戶需要配置安全域。
安全域:可選范圍0~9,不同安全域的脫敏策略規則不一致,即相同的待脫敏數據在不同的安全域脫敏出來的結果信息不一致。例如,原始數據為a123,安全域設置為0時,脫敏成b124,安全域設置為1時,脫敏成c234。原始數據相同時,如果安全域相同則脫敏后的數據也是相同的。
當選擇的敏感數據類型為非內置時,用戶需要配置替換字符集。
替換字符集:遇到字符集中的字符,即會被替換為其他相同類型的字符,不支持中文,若需要脫敏的數據不符合字符集范圍則不脫敏(可輸入大寫字母、小寫字母、和數字,多個字符請用英文逗號隔開),例如,敏感數據脫敏前是0~3的數字和a~d的字母組成,那么脫敏后也會脫敏成在這個范圍內的數字和字母。
哈希
可將原始數據加密成固定長度的數據。哈希脫敏方式需要選擇安全域。
安全域:可選范圍0~9,不同安全域的脫敏策略規則不一致,即相同的待脫敏數據在不同的安全域脫敏出來的結果信息不一致。例如,原始數據為a123,安全域設置為0時,脫敏成b124,安全域設置為1時,脫敏成c234。原始數據相同時,如果安全域相同則脫敏后的數據也是相同的。
掩蓋
掩蓋脫敏是對部分信息進行掩蓋,將對應位置上的字符用“*”替換,達到脫敏的效果。
推薦方式:下拉框可選擇只展示前1位和最后1位(默認選中)、只展示前3位和最后2位、只展示前3位和最后4位。
自定義:自定義設置提供了更加靈活的設置方式,可以在前中后三段設置是否脫敏,以及需要脫敏(或者不脫敏)的字符長度。最多可添加10個分段,至少要有1個分段是剩余位數。
圖標
描述
①
可選擇位數、剩余位數。
②
輸入范圍為【1,100】。
③
可選擇脫敏、不脫敏。
例如,脫敏前3位,剩余位數不脫敏。
例如,脫敏后3位,剩余位數不脫敏。
驗證脫敏配置結果:您可以在樣本數據文本框中輸入脫敏前樣本數據(輸入字符限制0~100字符)單擊脫敏驗證,在脫敏效果中會返回脫敏后的數據。
單擊確定,可以在脫敏規則下拉框中選擇該脫敏規則,同時新建的脫敏規則會同步到數據保護傘脫敏規則頁面。
單擊添加條件可新增一行配置數據字段的脫敏規則。
在字段列下拉框中選擇數據脫敏節點的上個節點的輸出字段。
在脫敏規則列下拉框中為字段選擇在數據保護傘>數據脫敏配置列表中所有已生效的脫敏規則。
在操作列單擊編輯。
如果是當前用戶創建的脫敏規則,在實時同步任務未提交前,可以單擊編輯在彈出的編輯脫敏規則窗口修改脫敏規則,并支持輸入樣本數據進行脫敏驗證。
如果是非當前用戶創建的脫敏規則,單擊編輯可以查看脫敏規則配置詳情,并支持輸入樣本數據進行脫敏驗證。
在操作列單擊刪除可以刪除一行字段。
輸出字段:展示要同步的原始表中對應字段和類型。