本文根據您的角色推薦不同的文檔閱讀順序。
如果您是MaxCompute初學者
如果您是初學者,建議先熟悉如下模塊,然后再有針對性地對深入學習其他模塊。
模塊 | 說明 |
介紹MaxCompute產品的概況、主要功能、應用場景、使用限制及基本概念。通過閱讀該章節,您會對MaxCompute有一個總體的認知。 | |
通過示例指導您如何準備賬號、準備環境、創建表、導入數據、運行SQL及導出結果數據。 | |
介紹MaxCompute的常用命令。您可以進一步熟悉如何操作MaxCompute。 | |
您需要在分析數據前掌握MaxCompute涉及的客戶端、MaxCompute Studio等工具。 | |
介紹MaxCompute各地域支持的連接方式及Endpoint信息,并對您在與其他云產品(ECS、Tablestore或OSS)互訪場景中遇到的網絡連通性和下載數據收費等問題進行說明。 |
如果您是數據分析師
如果您擁有一定開發經驗
如果您擁有一定的開發經驗,了解分布式概念,且希望解決某些無法用SQL實現的數據分析問題,推薦您學習MaxCompute更高級的功能模塊。
模塊 | 說明 |
MaxCompute提供Java MapReduce編程模型。您可以使用MapReduce提供的接口(Java API)編寫MapReduce程序,處理MaxCompute中的數據。 | |
一套面向迭代的圖計算處理框架。使用圖進行建模,圖由點(Vertex)和邊(Edge)組成,點和邊包含權值(Value)。通過迭代對圖進行編輯、演化,最終得出結果。 | |
您可以使用Tunnel服務向MaxCompute批量上傳離線數據或從MaxCompute下載離線數據。 | |
向開發者提供的Java接口。 | |
向開發者提供的Python接口。 |
如果您是項目Owner或管理員
如果您是一個項目的Owner(創建和使用項目)或管理員(管理項目、安全和費用)需要熟知如下模塊。
模塊 | 子模塊 | 說明 |
項目管理 | 創建項目前期工作 | 項目(Project)是MaxCompute的基本組織單元,它類似于傳統數據庫的Database或Schema的概念,是進行多用戶隔離和訪問控制的主要邊界。一個用戶可以同時擁有多個項目的權限,通過安全授權,可以在一個項目中訪問另一個項目中的對象,例如表(Table)、資源(Resource)、函數(Function)和實例(Instance)。使用MaxCompute,實際是操作項目中的各種對象。前期準備工作如下:
|
創建項目 | 創建項目具體操作,請參見創建MaxCompute項目。 創建項目時,需要從業務角度考慮選擇標準模式或簡單模式項目,從安全角度考慮使用個人賬號或計算引擎指定賬號,詳情請參見MaxCompute訪問身份和MaxCompute數據安全管理指南。 | |
項目成員管理 | 成員管理主要考慮成員的職責和安全問題,如果通過DataWorks使用MaxCompute,您需要考慮兩個產品之間的關聯權限,詳情請參見MaxCompute和DataWorks的權限關系。 | |
RAM用戶管理 | MaxCompute項目支持阿里云賬號和RAM用戶兩種賬號體系。您可以將阿里云賬號下的任意RAM用戶加入MaxCompute的某一個項目中。RAM用戶詳情,請參見創建RAM用戶。 通過DataWorks使用MaxCompute和DataWorks的工作空間,僅支持添加阿里云賬號下的RAM用戶為成員。因此,需要阿里云賬號通過RAM系統創建RAM用戶,并對RAM用戶進行維護管理。 說明
| |
調度資源管理 |
| |
項目設置 | 在項目開發過程中,部分項目的設置操作需要項目Owner來執行。例如,設置項目是否允許全表掃描、設置項目默認打開2.0新類型等。詳情請參見項目操作。 | |
安全管理 | 人員管理 | 安全管理包括人員管理、角色管理、權限管理等。通過DataWorks使用MaxCompute時,由于DataWorks和MaxCompute有各種權限模型,因此您需要理清楚兩個產品之間的權限關系,再從業務需求出發進行權限管理。安全管理過程中,您需要了解如何進行用戶授權、跨項目的資源共享、設置項目的數據保護功能、Policy授權等操作: |
角色管理 | ||
權限管理 | ||
費用管理 | 無 | 資源預算是在使用之前進行成本預估。基于MaxCompute的計費方式,很多業務無法更準確地預估成本,因此在整個業務開發過程中需要進行費用管理,主要需要關注: |