本文為您介紹如何通過MaxCompute客戶端,使用Tunnel Upload將本地數據文件中的數據導入創建好的表中。

前提條件

請確認您已滿足如下條件:

步驟一:導入數據

基于Tunnel Upload將本地數據文件內容導入MaxCompute的表中。更多Tunnel操作,請參見Tunnel命令。導入數據的操作流程如下:

  1. 確認數據文件的保存路徑。
    數據文件的保存路徑有兩種選擇:您可以將文件直接歸檔至MaxCompute客戶端的bin目錄中,上傳路徑為文件名.后綴名;也可以將文件歸檔至其他路徑下,例如D盤的test文件夾,上傳路徑為D:\test\文件名.后綴名

    假設,本文中的示例數據文件banking.txt保存在MaxCompute客戶端的bin目錄中,banking_yescreditcard.csvbanking_uncreditcard.csvbanking_nocreditcard.csv保存在D盤的test文件夾下。

  2. 在MaxCompute客戶端,執行Tunnel Upload命令導入數據。
    命令示例如下。
    tunnel upload banking.txt bank_data;
    tunnel upload D:\test\banking_yescreditcard.csv bank_data_pt/credit="yes";
    tunnel upload D:\test\banking_uncreditcard.csv bank_data_pt/credit="unknown";
    tunnel upload D:\test\banking_nocreditcard.csv bank_data_pt/credit="no";
    當出現圖示OK字樣,說明導入完成。上傳成功

步驟二:確認導入結果

導入數據后,您需要查看導入的目標表與數據文件中的數據條數是否一致,確認所有數據均已成功導入。

本文中的示例數據文件banking.txt中有41188條數據,banking_yescreditcard.csvbanking_uncreditcard.csvbanking_nocreditcard.csv分別有3、8597、32588條數據。命令示例如下。

select count(*) as num1 from bank_data;
select count(*) as num2 from bank_data_pt where credit="yes";
select count(*) as num3 from bank_data_pt where credit="unknown";
select count(*) as num4 from bank_data_pt where credit="no";

返回結果如下。

--bank_data中的數據條數。
+------------+
| num1       |
+------------+
| 41188      |
+------------+
--bank_data_pt中credit值為yes的數據條數。
+------------+
| num2       |
+------------+
| 3          |
+------------+
--bank_data_pt中credit值為unknown的數據條數。
+------------+
| num3       |
+------------+
| 8597       |
+------------+
--bank_data_pt中credit值為no的數據條數。
+------------+
| num4       |
+------------+
| 32588      |
+------------+

上述命令的返回結果與示例數據文件的數據條數一致,則表明導入成功。

后續步驟

當數據導入到MaxCompute的表中后,您可以在MaxCompute客戶端上運行SQL命令處理數據并導出運行結果,請參見運行SQL命令并導出結果數據