DataWorks數據集成實時ETL支持字符串替換組件使用,可以在來源與去向組件間新增字符串替換組件,對字符串進行替換。
前提條件
已完成數據集成的基本配置與網絡資源配置。
數據集成的同步類型為單表實時。
步驟一:配置數據集成任務
新建數據源,詳情請參見:創建并管理數據源。
新建數據集成任務,詳情請參見:數據集成側同步任務。
說明當數據集成側同步任務的同步類型為單表實時,可在數據來源組件與數據去向組件之間新增數據處理組件。詳情可參見支持的數據源及同步方案。
步驟二:添加字符串替換組件
在實時ETL任務編輯頁DAG畫布中,單擊來源與去向組件之間的按鈕,新增選擇字符串替換組件。
配置替換規則。
將命中規則的數據替換成新的字符串。
規則配置:
字段名:選擇前一個步驟的文本類型輸入字段。
原字符串:查找的原字符串,當關閉正則匹配時,支持Java轉義字符,例如
\t
(制表符)、\n
(換行符)、\u0001
(unicode字符)。新字符串:替換后的新字符串,當關閉正則匹配時,支持Java轉義字符,例如
\t
(制表符)、\n
(換行符)、\u0001
(unicode字符)檢索時:可配置正則匹配與大小寫敏感。
說明正則匹配:是否啟用正則表達式匹配,開啟正則匹配時,原字符串支持的正則表達式規則參考Class Pattern,新字符串替換支持使用
$+數字
引用正則表達式中的分組,例如字段內容為no.9526
,原字符串配置no.([0-9]+)
,新字符串配置$1
,則替換后的字段內容為9526
。大小寫敏感:原字符串查找是否大小寫敏感。
添加條件:單擊添加條件可新增一條規則。
輸出字段:來源數據替換后的輸出字段名,與輸入字段名和格式一致。
后續操作
完成來源信息、字符串替換以及去向信息的配置后,可單擊右上角的模擬運行,對數據集成任務進行模擬運行,以便查看輸出數據結果,是否符合您的需求。