DataX
本文中含有需要您注意的重要提示信息,忽略該信息可能對您的業(yè)務(wù)造成影響,請務(wù)必仔細(xì)閱讀。
DataX任務(wù)類型,用于執(zhí)行DataX程序。本文為您介紹創(chuàng)建DataX類型任務(wù)時(shí)涉及的參數(shù)。
參數(shù)說明
參數(shù) | 說明 |
節(jié)點(diǎn)名稱 | 任務(wù)的名稱。一個(gè)工作流定義中的節(jié)點(diǎn)名稱是唯一的。 |
運(yùn)行標(biāo)志 |
|
描述 | 節(jié)點(diǎn)的描述。 |
任務(wù)優(yōu)先級 | 流程運(yùn)行的優(yōu)先級。支持以下級別:
|
失敗重試次數(shù) | 工作流運(yùn)行失敗自動重試的次數(shù)。 |
失敗重試間隔 | 每次失敗重試的間隔。單位:分。 |
延時(shí)執(zhí)行時(shí)間 | 延時(shí)執(zhí)行時(shí)間,默認(rèn)為0,即立即執(zhí)行,設(shè)置了該值后才執(zhí)行延時(shí)操作。單位:分。 |
超時(shí)告警 | 該開關(guān)默認(rèn)關(guān)閉。打開超時(shí)告警開關(guān),可設(shè)定超時(shí)時(shí)長,并選擇至少一個(gè)超時(shí)策略。
|
任務(wù)提交節(jié)點(diǎn) | 僅支持EMR集群worker節(jié)點(diǎn)(提交到Y(jié)arn執(zhí)行),表示任務(wù)在EMR集群的Worker節(jié)點(diǎn)提交,占用一個(gè)YARN Container。 警告 該模式會直接影響EMR集群的文件系統(tǒng)或運(yùn)行環(huán)境,請謹(jǐn)慎操作。 使用該模式,您還可以選擇配置以下參數(shù):
|
自定義DATAX作業(yè)配置(JSON) | 默認(rèn)關(guān)閉,啟用該參數(shù)后,還需配置DATAX作業(yè)配置(JSON),編寫JSON格式的配置文件。 |
數(shù)據(jù)源類型 | 選擇抽取數(shù)據(jù)的數(shù)據(jù)源類型。 |
數(shù)據(jù)源實(shí)例 | 選擇在數(shù)據(jù)源中心中創(chuàng)建的數(shù)據(jù)源。 |
數(shù)據(jù)源篩選SQL | 從數(shù)據(jù)源中抽取數(shù)據(jù)的SQL語句。當(dāng)節(jié)點(diǎn)執(zhí)行SQL時(shí)會自動解析SQL查詢的列名,并將其映射為目標(biāo)表的同步列名。當(dāng)源表和目標(biāo)表的列名不一致時(shí),可以通過使用列別名(AS)來進(jìn)行轉(zhuǎn)換。 |
目標(biāo)源類型 | 選擇同步數(shù)據(jù)的數(shù)據(jù)源類型。 |
目標(biāo)源實(shí)例 | 選擇在數(shù)據(jù)源中心中創(chuàng)建的目標(biāo)數(shù)據(jù)源,以同步數(shù)據(jù)。 |
目標(biāo)表 | 選擇同步數(shù)據(jù)的表。 |
目標(biāo)庫前置SQL(preSql) | SQL語句執(zhí)行前,執(zhí)行前置SQL。 |
目標(biāo)庫后置SQL(postSql) | SQL語句執(zhí)行完成后,執(zhí)行后置SQL。 |
限流(字節(jié)數(shù)) | 限制查詢結(jié)果返回的字節(jié)數(shù)量。 |
限流(記錄數(shù)) | 限制查詢結(jié)果返回的記錄數(shù)量。 |
自定義參數(shù) | 任務(wù)自定義參數(shù),會替換腳本中 |
前置任務(wù) | 設(shè)置當(dāng)前任務(wù)的前置(上游)任務(wù)。 |