本文為您介紹數據質量監控規則的配置流程及生效邏輯,以及規則列表的相關操作。
規則配置流程
您可基于表配置單個表的數據質量監控規則,也可基于模板,批量配置多個表的數據質量監控規則,具體如下。
基于表配置數據質量監控規則(單個配置監控規則)
按表配置質量規則主要流程如下:
選擇待配置規則校驗的表。
為表創建質量監控。
以校驗的表的具體數據范圍為對象(如分區表的具體分區),通過質量規則關聯質量監控的方式,定義對象數據需要進行哪些質量規則校驗。
可新建多個質量監控校驗同一張表的不同分區,每個質量監控關聯不同的質量規則,達到同一張表不同分區數據質量校驗邏輯不同的目的。
定義質量監控的觸發方式,即是否在調度節點運行時觸發規則校驗,還是需要手動觸發才會進行該表質量校驗。
定義何種情況下需要發送告警信息,您可根據數據校驗結果異常等級自行決定何種異常需要發送告警信息。當表數據變更自動進行數據質量規則校驗時,您可根據數據異常程度決定是否需要阻塞任務執行。
配置數據質量規則添加到質量監控中。
以質量監控中需要校驗的表為對象,定義該表數據質量校驗規則的校驗方式。通過數據質量規則定義對該表數據的具體校驗方式,從而確定該表數據是否符合預期。
數據質量監控規則包括基于模板創建的系統模板規則,以及可自定義SQL邏輯的自定義模板規則。其中:
測試及訂閱質量監控。
具體配置操作,詳情請參見配置規則:按表(單表)。
基于模板配置數據質量監控規則(批量配置監控規則)
按模板配置質量規則的主要流程如下:
內置模板分為表級和字段級的模板規則,選擇模板后,以待校驗的表為對象,定義該表數據質量校驗規則的校驗方式。通過數據質量規則定義對該表數據的具體校驗方式,從而確定表數據是否符合預期。
選擇待批量校驗的表或字段,將規則模板應用到目標表上。
以校驗的表的具體數據范圍為對象(如分區表的具體分區),通過質量規則關聯質量監控的方式,定義對象數據需要進行哪些質量規則校驗。
具體配置操作,詳情請參見配置規則:按模板(批量)。
進入規則列表
進入數據質量頁面。
登錄DataWorks控制臺,切換至目標地域后,單擊左側導航欄的 ,在下拉框中選擇對應工作空間后單擊進入數據質量。
在左側導航欄選擇 ,進入數據質量監控規則列表頁面。
查看規則列表
區域 | 功能 | 描述 |
① | 數據庫選擇 | 您可以根據需要先選擇待查看規則列表所在的數據庫。 |
② | 過濾項 | 您可以通過篩選條件過濾需要查詢的質量規則。 您可以根據表名、規則模板、重要程度、啟用狀態、關聯范圍、關聯調度等條件進行精確篩選。 |
③ | 質量規則列表 | 為您展示ID/規則名稱、表名、關聯范圍、規則模板、監控閾值、質量監控數據范圍、重要程度、啟用狀態、關聯調度等質量規則詳細信息,同時您可以在操作列對規則進行修改、訂閱管理、刪除或查看日志等操作。
|
④ | 批量操作 | 您可以批量選擇規則,進行關聯調度、訂閱管理、批量啟動、批量停止和批量刪除等操作。 |