JOIN
更新時間:
在Map階段進行表之間的連接,而不需要進入到Reduce階段才進行連接。這樣可以節(jié)省在Shuffle階段時要進行的大量數(shù)據(jù)傳輸工作,從而達到優(yōu)化作業(yè)的目的。例如,當需要連接一個大表和一個小表時,您也可以將小表加載到內存中,從而提高運行效率。
配置組件
在Designer工作流頁面添加JOIN組件(僅支持可視化方式配置),并在界面右側配置相關參數(shù):
參數(shù) | 描述 |
連接類型 | 支持左連接、內連接、右連接和全連接。 |
MapJoin優(yōu)化 | 將小表加載到內存中,提高運行速度。取值:
|
關聯(lián)條件 | 僅支持等式,可手動添加或刪除關聯(lián)條件。 |
選擇左表輸出字段列 | 選擇左表輸出字段列。 |
選擇右表輸出字段列 | 選擇右表輸出字段列。 |
文檔內容是否對您有幫助?