本文為您介紹如何使用HoloStudio導入MaxCompute數據至Hologres。
HoloStudio已下線,詳情請參見DataWorks HoloStudio下線公告。
前提條件
阿里云賬號注冊,詳情請參見阿里云賬號注冊流程。
開通實時數倉Hologres并綁定至DataWorks工作空間,詳情請參見DataWorks快速入門。
背景信息
HoloStudio支持一鍵MaxCompute數據同步功能,您可以使用可視化方式導入MaxCompute表數據并進行查詢。該方式比創建外部表直接查詢數據的性能更好。
您也可以使用SQL語句導入MaxCompute數據,詳情請參見使用SQL從MaxCompute導入。
操作步驟
登錄阿里云官網。
新建一鍵MaxCompute數據同步節點。
在頁面上方選擇目標地域。
在左側菜單欄單擊前往DataStudio,前往DataWorks-HoloStudio開發。
在Holo Studio頁面的左側導航欄,單擊圖標。
進入數據開發頁面,鼠標懸停至頂部菜單欄的圖標。
單擊一鍵MaxCompute數據同步。
在新建節點對話框中,輸入節點名稱,并選擇目標文件夾和數據庫。
單擊提交。
在編輯節點頁面,配置各項參數。
參數
描述
外部表來源
已有外部表:表示在Hologres中已經建立MaxCompute數據映射的外部表。
新建外部表:表示外部表在Hologres中未建立MaxCompute數據映射。如果您需要導入MaxCompute表數據,請選中新建外部表。
外部表表名字
已創建的外部表表名稱。
Hologres中創建的外部表用于映射MaxCompute數據,需要與導入數據的MaxCompute表結構一一對應。
目標庫
Hologres的數據庫名稱。
目標Schema
當前數據庫的Schema名稱。
如果您沒有新建Schema,則只能選擇默認創建的public。如果有新建的Schema,您也可以選擇新建的Schema。
目標表名
需要導入數據的表名稱。
目標表描述
目標表的信息描述。
同步字段
需要導入的MaxCompute表字段。
您可以選擇導入部分或全部字段。
分區配置
需要導入的分區字段。
一鍵MaxCompute數據同步功能僅支持導入一級分區。如果您需要導入多級分區,請在SQL Console中使用SQL語句實現,詳情請參見SQL Console。
索引配置
您可以為目標表創建索引,詳情請參見CREATE TABLE。
SQL Script
自動解析當前可視化操作對應的SQL語句。
在新建節點的編輯頁面,單擊圖標,保存配置信息。
在新建節點的編輯頁面,單擊圖標,導入MaxCompute表數據。
在PG管理頁面,查看導入的外部表數據,詳情請參見創建及管理外部表或SQL Console。