通過可視化方式導入MaxCompute數(shù)據(jù)至Hologres
本文為您介紹如何使用HoloWeb,通過可視化的方式快捷導入MaxCompute數(shù)據(jù)。
前提條件
存在已登錄實例,請參見登錄實例。
背景信息
HoloWeb支持一鍵同步MaxCompute數(shù)據(jù)功能,您可以使用可視化方式導入MaxCompute表數(shù)據(jù)并進行查詢。該方式比創(chuàng)建外部表直接查詢數(shù)據(jù)的性能更好。
操作步驟
在頂部菜單欄左側(cè),選擇相應的地域。
單擊前往HoloWeb,進入HoloWeb開發(fā)頁面。
在HoloWeb開發(fā)頁面的頂部菜單欄,選擇 ,單擊一鍵MaxCompute數(shù)據(jù)導入。
配置新建MaxCompute數(shù)據(jù)導入頁面的各項參數(shù)。
參數(shù)描述如下表所示。
類別
參數(shù)
描述
選擇實例
實例名
已登錄的實例名稱。
MaxCompute 源表
項目名
MaxCompute的項目名稱。
Schema Name
MaxCompute的Schema名稱,對于使用兩層模型的MaxCompute項目,默認不展示;對于使用三層模型的MaxCompute項目,此處可下拉選擇當前項目下有權(quán)限的所有Schema。
表名
MaxCompute的表名稱,支持基于前綴模糊搜索。
Hologres 目標表
數(shù)據(jù)庫名
選擇內(nèi)部表所在的Hologres數(shù)據(jù)庫名稱。
Schema Name
Hologres的Schema名稱。
默認為public Schema,您也可以選擇其他有權(quán)限的Schema。
表名
新建的Hologres內(nèi)部表名稱。
選擇MaxCompute表后,將會自動填入MaxCompute表名稱,您也可以手動重命名。
目標表描述
新建的Hologres內(nèi)部表描述,可自定義修改。
參數(shù)設置
GUC參數(shù)
輸入需要設定的GUC參數(shù)。GUC參數(shù)詳情請參見GUC參數(shù)。
導入設置
字段
需要導入的MaxCompute表字段。
您可以選擇導入部分或全部字段。
分區(qū)配置
分區(qū)字段
選擇分區(qū)字段,Hologres將會默認將表創(chuàng)建為分區(qū)表。
Hologres僅支持一級分區(qū)。如果您需要導入MaxCompute的多級分區(qū),則在Hologres中設置一級分區(qū)即可,其余分區(qū)自動映射為Hologres的普通字段。
業(yè)務日期
如果MaxCompute表使用日期進行分區(qū),則您可以選擇具體的分區(qū)日期,系統(tǒng)將會導入指定日期的數(shù)據(jù)至MaxCompute表。
索引配置
存儲模式
列存,適用于各種復雜查詢。
行存,適用于基于主鍵的點查詢和Scan。
行列共存,支持行存和列存的所有場景,以及非主鍵點查的場景。
如果不指定存儲模式,則默認為列存。
表數(shù)據(jù)生命周期
表數(shù)據(jù)的生命周期。默認為永久存儲。
指定生命周期后,如果數(shù)據(jù)在指定時間內(nèi)未被修改,則引擎將會在到期后的某一個時間段刪除數(shù)據(jù)。
Binlog
是否開啟Binlog,詳情請參見訂閱Hologres Binlog。
Binlog生命周期
Binlog的TTL,默認為30天,即默認值為2592000秒。
分布列
Hologres會按照分布列指定的列將數(shù)據(jù)shuffle到各個Shard,同樣的數(shù)值會在同樣的Shard中。以分布列做過濾條件時,可以大大提高執(zhí)行效率。
分段列
您可以指定部分列作為分段鍵Segment_key。當查詢條件包含分段列時,您可以通過分段鍵快速查找相應數(shù)據(jù)的存儲位置。
聚簇列
您可以指定部分列作為聚簇索引Clustering_key。索引的類型和列的順序密切相關。聚簇索引幫助您加速執(zhí)行索引列的Range和Filter查詢。
字典編碼列
Hologres支持為指定列的值構(gòu)建字典映射。字典編碼可以將字符串的比較轉(zhuǎn)換為數(shù)字的比較,加速Group By和Filter查詢。
默認設置所有text列至字典編碼列中。
位圖列
Hologres支持在位圖列構(gòu)建比特編碼。位圖列可以根據(jù)設置的條件快速過濾字段內(nèi)部的數(shù)據(jù)。
默認設置所有text列至位圖列中。
SQL Script為您自動解析當前可視化操作對應的SQL語句。
單擊右上角的提交。