日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

文檔

DataWorks On MaxCompute使用說明

更新時間:

DataWorks基于云原生大數據計算服務MaxCompute輕松構建離線數倉分析系統。MaxCompute可通過DataWorks提供的可視化方式配置任務工作流、周期性調度執行任務及元數據管理,保障數據生產及管理的高效穩定。本文為您介紹在DataWorks上開發MaxCompute任務的基本流程、費用說明、環境準備、權限控制等內容。

前提條件

使用說明

DataWorks on MaxCompute的相關開發說明如下。

類別

說明

費用說明

在DataWorks上進行MaxCompute任務開發,除DataWorks側產品費用外,還會產出其他產品側費用。

環境準備

在DataWorks上進行MaxCompute任務開發前,您需根據業務需求購買相應DataWorks版本及所需資源組,并完成相關MaxCompute數據源的創建及綁定工作。

權限控制

DataWorks提供DataWorks產品級與模塊級權限控制,以及MaxCompute數據源的可視化權限申請與審批能力。

開始使用:數據集成

DataWorks數據集成提供MaxCompute數據讀取與寫入的能力,并提供離線同步、實時同步、全增量同步任務等多種數據同步場景。

開始使用:數據建模與開發

DataWorks提供數據建模服務,將無序、雜亂、繁瑣、龐大且難以管理的數據,進行結構化有序的管理。還提供數據開發(DataStudio)功能,用于調度任務的開發,并與運維中心配合使用,進行調度任務的監控運維。

開始使用:數據分析

DataWorks數據分析提供MaxCompute數據分析與服務共享能力。

開始使用:數據治理

DataWorks提供MaxCompute元數據管理與數據治理能力。

開始使用:數據服務

DataWorks提供數據服務能力,幫助您統一管理面向內外部的API服務。

開始使用:開放平臺

DataWorks支持開放能力,幫助您快速實現各類應用系統對接DataWorks,并進行數據流程管控、數據治理和運維,及時響應各應用系統對接DataWorks的業務狀態變化。

費用說明

DataWorks數據開發與運維中心提供MaxCompute數據同步、數據加工任務的周期調度,不僅包含DataWorks相關費用,同時會產生產品側其他費用,具體如下。

一、DataWorks相關費用

以下費用會體現在DataWorks產品相關賬單中。DataWorks計費詳情請參見DataWorks計費項說明

費用

說明

DataWorks版本費用

進行任務開發前,您需先開通DataWorks。如果開通的是DataWorks標準版、專業版、企業版,則在開通時需支付相應版本的版本費用。

任務調度的調度資源費用

任務開發完成后,進行任務調度需使用調度資源。您可使用Serverless資源組(推薦)或舊版獨享調度資源組,支付相應資源組費用。

說明

購買的Serverless資源組可滿足任務調度、數據同步共同使用。

數據同步的同步資源費用

運行數據同步任務時,除調度資源外,還需使用數據同步資源。您可使用Serverless資源組(推薦)或舊版獨享數據集成資源組,支付相應資源組費用。

說明
  • DataStudio界面使用運行、帶參運行功能執行的任務,不會收取調度費用。

  • 沒有實際執行成功的任務及空跑的任務不收取調度費用。

您可參考DataWorks調度任務下發邏輯,以輔助了解上述計費說明。

二、非DataWorks相關費用

以下費用不會體現在DataWorks產品相關賬單中。任務開發運行過程中可能會產生的其他費用如下。

重要

其他產品收費情況由對應產品的計費邏輯決定,您可查看對應產品的計費文檔了解詳情。以MaxCompute為例,計費詳情請參見MaxCompute計費項說明

費用

說明

數據庫費用

數據同步時,讀寫上下游數據庫中的數據,可能會產生數據庫費用。

計算和存儲費用

運行計算引擎任務時,可能會產生計算引擎的計算和存儲費用。例如,運行一個MaxCompute的SQL任務,新建表并寫入表數據,可能會產生MaxCompute的計算和存儲費用。

網絡服務費用

連通DataWorks和其他相關產品的網絡環境時,可能會產生網絡服務費用。例如,使用高速通道、共享帶寬、EIP等產品連通網絡時,會產生相應產品的服務費用。

環境準備

一、資源準備

DataWorks提供具備豐富產品能力的標準版、專業版、企業版,以及租戶專有的Serverless資源組,您可結合實際業務開發需要選擇。

類別

描述

相關文檔

版本選擇

DataWorks基礎版服務可滿足MaxCompute開發中基本的數據上云、數據開發與調度生產、簡單的數據治理工作,若需獲取更專業的數據治理、數據安全解決方案,可選擇相應的標準版、專業版、企業版服務。

DataWorks標準版、專業版、企業版對比及版本升級說明

資源組選擇

  • Serverless資源組(推薦):支持一個資源組可以被所有功能(數據集成、數據調度、數據服務)使用,您在使用過程中可以根據業務情況合理規劃并分配資源。

  • 舊版資源組(獨享資源組和公共資源組):可滿足基本調度要求,計劃未來下線。

DataWorks資源組概述

二、開發環境準備

您需先將MaxCompute項目創建為DataWorks工作空間的數據源并綁定至數據開發(DataStudio),才可進行相關開發工作。同時,支持以工作空間為單位管理空間成員以便進行協同開發。

類別

描述

相關文檔

數據同步環境準備

基于DataWorks進行MaxCompute同步任務前,您需先將MaxCompute項目創建為工作空間的數據源。創建后,才可使用該數據源執行相關同步任務。

創建MaxCompute數據源

數據開發、數據分析環境準備

基于DataWorks進行MaxCompute調度任務前,您需先將MaxCompute項目創建為工作空間的數據源并綁定至數據開發(DataStudio)。綁定后,才可使用該數據源進行相關數據開發、數據分析、周期性調度運行任務等操作。

協同開發環境準備

為保障RAM用戶以工作空間為單位進行協同開發,需將進行協同開發的RAM用戶添加為當前工作空間的成員,并授予其開發角色。

工作空間添加成員

權限控制

DataWorks為您提供了產品級與模塊級的權限控制,并支持使用可視化方式申請與審批MaxCompute數據源的相關權限。權限控制相關介紹如下。

一、數據訪問與權限控制

您可通過ODPS SQL節點或臨時查詢節點,查詢MaxCompute表數據,簡單模式工作空間無法做到細粒度權限控制及開發生產隔離,本文以標準模式工作空間示例說明。

  • 權限預設情況說明

    RAM用戶被添加至工作空間成為空間成員后,其數據訪問權限預設情況如下。

    權限類別

    描述

    MaxCompute開發項目權限

    DataWorks通過空間級預設角色與開發環境MaxCompute數據源Role的映射關系,讓被授予空間角色的RAM用戶(子賬號)擁有該角色映射的開發數據源權限,默認擁有開發環境對應的數據源項目權限,但無生產環境對應的數據源項目權限。

    MaxCompute生產項目權限

    除被授予調度訪問身份的RAM用戶(子賬號)擁有生產環境MaxCompute項目較大權限外,其他RAM用戶(子賬號)沒有生產環境項目權限。如需操作生產表,請前往安全中心申請權限。

    DataWorks為您提供了默認的審批流程,同時,也支持管理者自定義審批流程。

    更多關于MaxCompute數據訪問權限控制說明,請參見MaxCompute數據權限控制詳情

  • 數據訪問行為說明

    MaxCompute支持跨項目查詢表,因此,在數據開發(DataStudio)界面可通過指定項目名稱的方式,跨項目查詢DataWorks工作空間中的生產數據。跨項目訪問表的方式及各界面執行所使用的賬號說明,請見下表。

    說明
    • 不同環境創建的數據源及環境配置的執行賬號,可查看工作空間的數據源信息。詳情請參見創建MaxCompute數據源

    • DataWorks標準模式工作空間下,開發環境默認使用任務執行者個人身份執行任務,生產調度環境默認使用某云賬號執行任務,即調度訪問身份。詳情請參見創建MaxCompute數據源

    代碼示例

    開發環境(數據開發、開發環境運維中心)執行代碼

    生產環境(生產環境運維中心)執行代碼

    訪問開發項目中的開發表:

    select col1 from projectname_dev.tablename;

    使用任務執行者個人云賬號訪問開發表。

    • RAM用戶(子賬號)執行相關任務,則使用RAM用戶(子賬號)個人云賬號訪問開發表。

    • 阿里云主賬號執行相關任務,則使用阿里云主賬號訪問開發表。

    使用調度訪問身份訪問開發表。

    訪問生產項目中的生產表:

    select col1 from projectname.tablename;

    使用任務執行者個人云賬號訪問生產表。

    說明

    由于生產數據安全控制,個人云賬號默認無權限訪問生產表,需前往安全中心進行申請。DataWorks提供默認審批流程,支持管理者自定義審批流程。

    使用調度訪問身份訪問生產表。

    在目標類型環境(例如,開發環境)執行語句,訪問相應環境中的表(即開發表):

    select col1 from tablename;

    在開發環境執行時,使用任務執行者個人云賬號訪問身份,訪問開發數據源中目標表。

    在生產環境執行時,使用調度訪問身份,訪問生產數據源中目標表。

二、功能模塊權限控制

進行數據開發前,您可為用戶授權指引授予工作空間成員不同空間角色,讓其擁有不同的操作權限。權限類型如下:

  • 通過RAM Policy權限體系,管理DataWorks功能模塊(例如,不允許用戶訪問數據地圖)與DataWorks控制臺的權限(例如,允許用戶刪除工作空間)。

  • 通過RBAC權限模型,管理DataWorks空間級模塊(例如,允許用戶進入數據開發執行相關開發操作)與全局模塊的使用權限(例如,禁止用戶訪問數據保護傘模塊)。

開發流程

開始使用

DataWorks為您提供了多個功能模塊,您可在數據開發(DataStudio)中進行調度任務的開發,并在開發完成后進入生產運維中心進行調度任務的監控運維。同時,提供了任務開發與發布的流程管控,助力您規范開發操作,保障開發過程的安全性。

一、數據集成

DataWorks的數據集成模塊為您提供讀取和寫入數據至MaxCompute的能力,您可將其他數據源的數據同步至MaxCompute數據源,或將MaxCompute數據源的數據同步至其他數據源。同時,可根據需要選擇離線同步、實時同步、全增量同步任務等場景執行相關數據同步操作。詳情請參見數據集成

二、數據建模與開發

模塊

描述

相關文檔

數據建模

數據建模是全鏈路數據治理的第一步,沉淀阿里巴巴數據中臺建模方法論,從數倉規劃、數據標準、維度建模、數據指標四個方面,以業務視角對業務的數據進行詮釋,讓企業內部實現“數同文”的快速理解與流通。

數據建模

數據開發

DataWorks將MaxCompute計算引擎的能力進行了封裝,支持您執行MaxCompute相關的數據同步、數據開發任務。

  • 數據同步:您可將其他數據源的數據同步至MaxCompute數據源,或將MaxCompute數據源的數據同步至其他數據源。數據開發僅支持部分離線同步和實時同步場景,更多數據同步應用,請前往數據集成主站查看。

  • 數據開發:您無需接觸復雜的命令行,便可在DataWorks中實現各類任務的開發及周期性調度。

您可結合DataWorks的通用類型節點和引擎計算節點進行復雜的邏輯處理。

主要節點如下:

  • 用于管控業務流程的虛擬節點。

  • 用于外部系統觸發調度的HTTP觸發器節點、OSS對象檢查節點和FTP CHECK節點。

  • 用于節點上下游參數傳遞的賦值節點與參數節點。

  • 用于循環執行代碼的do-while節點,遍歷、判斷上游賦值結果的for-each節點,分支節點等。

  • 其他節點。例如,通用Shell節點,MySQL數據庫節點等。

節點任務開發完成后,可根據需要執行如下操作:

  • 調度配置

    若節點任務需進行周期性調度運行,可定義該節點的調度相關屬性。例如,節點調度依賴、調度參數等。

  • 節點調試

    為保障生產任務高效運行,避免計算資源浪費,建議您在任務發布前先對任務進行調試運行。

  • 節點發布

    任務需發布至生產環境后,才會周期調度運行。因此,任務開發完成后需發布至生產環境。發布后,您可前往運維中心 > 周期任務界面查看并管理該調度任務。

  • 節點管理

    您可對節點任務進行上線及下線、批量修改調度相關屬性等操作。

  • 流程管控

    DataWorks提供了任務開發與發布的流程管控(例如,代碼審批、強制冒煙測試、自定義校驗邏輯等),把控任務相關操作的正確性及安全性。

運維中心

運維中心是一站式大數據運維、監控平臺,支持實時查看任務的運行狀態,并為異常任務提供智能診斷、重跑等運維操作。它提供智能基線功能,幫助您解決重要任務產出時間不可控、海量任務監控難等問題,保障任務產出的時效性。

周期任務基本運維操作

數據質量

數據質量針對數據研發的全鏈路,保障數據可用性。通過對數據質量規則的高效校驗,以及與任務調度流程的緊密結合,可以幫助用戶第一時間發現質量問題、有效防止數據質量問題擴散,為業務提供高效、可靠、可信賴的數據。

數據質量概述

三、數據分析

幫助您實現在線SQL分析、業務洞察、編輯和分享數據;并支持將查詢結果保存為圖表卡片,快速搭建可視化數據報告便于日常匯報。詳情請參見數據分析概述

四、數據治理

MaxCompute數據源綁定完成后,DataWorks將自動采集您數據源下的元數據,您可前往數據地圖進行查看;同時,也可進入數據治理中心,查看DataWorks檢測的待治理問題,進行相關數據的治理。

模塊

說明

相關文檔

數據地圖

DataWorks數據地圖提供了企業級數據管理平臺,能夠基于統一元數據的底層建設,提供數據對象的管理和盤點的能力,以及數據對象的快速查找和深度理解的能力。

數據地圖概述

安全中心

數據保護傘

審批中心

安全中心是集數據資產分級分類、敏感數據識別、數據授權管理、敏感數據脫敏、敏感數據訪問審計、風險識別與響應于一體的一站式數據安全治理界面,幫助用戶落地數據安全治理事項。

數據治理中心

數據治理中心針對多個治理領域,通過數據領域規則沉淀、自動識別資產待優化問題項、覆蓋事后及事前的治理優化策略等方式幫助用戶主動式、體系化完成數據治理工作。

數據治理中心概述

五、數據服務

DataWorks數據服務旨在為企業提供全面的數據服務及共享能力,幫助企業統一管理面向內外部的API服務。詳情請參見數據服務概述

六、開放平臺

DataWorks支持開放能力,幫助您快速實現各類應用系統對接DataWorks、方便快捷的進行數據流程管控、數據治理和運維,及時響應應用系統對接DataWorks的業務狀態變化。

類別

描述

相關文檔

OpenAPI

DataWorks開放平臺的OpenAPI功能,為您提供開放API能力,通過開放API實現本地服務和DataWorks服務的交互,提升企業大數據處理效率,減少人工操作和運維工作,降低數據風險和企業成本。

開放API(OpenAPI)

開放事件

DataWorks開放平臺的開放事件(OpenEvent)功能,為您提供消息訂閱服務,通過訂閱DataWorks事件狀態、應用系統對接DataWorks、實時獲取相關內容的狀態變化,幫助您及時響應相應事件,滿足個性化決策需求。

OpenEvent概述

擴展程序

DataWorks通過OpenEvent為您提供消息推送訂閱功能,您可將服務程序注冊為DataWorks的擴展程序,通過擴展程序來卡點并響應訂閱的事件消息,實現通過擴展程序對特定事件進行消息通知與流程管控。

擴展程序概述

附錄:DataWorks與MaxCompute的關系

說明

簡單模式工作空間僅一個生產環境,并且僅對應MaxCompute一個項目,本文以標準模式工作空間進行說明。

DataWorks為MaxCompute提供任務調度、元數據管理、數據治理、數據安全管控等能力,但任務計算、數據存儲仍在MaxCompute中。標準模式工作空間下,DataWorks為不同環境綁定不同的MaxCompute項目,實現DataWorks開發環境與生產環境存儲、資源等隔離。

引擎綁定