EMR Studio是E-MapReduce提供的開源大數(shù)據(jù)開發(fā)套件,包含Apache Zeppelin、Jupyter Notebook和Apache Airflow等開源組件。能夠無縫關聯(lián)EMR集群(EMR on ECS和EMR on ACK)的計算引擎提交任務,并提供了交互式開發(fā)、任務調度和任務監(jiān)控等開源大數(shù)據(jù)開發(fā)使用體驗。覆蓋了大數(shù)據(jù)處理ETL、交互式數(shù)據(jù)分析、機器學習和實時計算等多種應用場景。

EMR Studio核心優(yōu)勢

優(yōu)勢 描述
兼容開源 EMR Studio提供深度優(yōu)化的開源組件使用體驗,100%兼容開源大數(shù)據(jù)生態(tài)。您無需修改任務代碼,即可平滑遷移上云。通過EMR Studio數(shù)據(jù)開發(fā)工作臺,您可以在開源組件原生UI的基礎上無縫銜接開發(fā)環(huán)節(jié)和生產調度環(huán)節(jié)。Studio
簡化運維 EMR Studio提供開箱即用的大數(shù)據(jù)開發(fā)環(huán)境,可以快速響應業(yè)務需求。您可以將EMR Studio一鍵關聯(lián)至EMR集群(EMR on ECS、EMR on ACK)提交作業(yè),并可以在不關閉Notebook的情況下切換計算集群。EMR Studio自動適配Hive、Spark、Flink、Presto和Impala等多個計算引擎并協(xié)同工作。EMR Studio提供了統(tǒng)一的用戶管理和認證能力,您可以控制用戶訪問數(shù)據(jù)開發(fā)控制臺。EMR Studio已與阿里云云監(jiān)控服務集成,您可以在云監(jiān)控中靈活配置任務調度監(jiān)控,保障開發(fā)環(huán)境穩(wěn)定。
節(jié)省成本 您可以根據(jù)任務負載靈活變更EMR Studio的硬件資源,壓縮調度資源成本。EMR Studio支持使用集群模板功能,您可以設置EMR Studio動態(tài)拉起EMR計算集群運行臨時任務,當任務結束時自動釋放計算集群,能夠極大降低計算資源成本。集群模板功能詳情,請參見創(chuàng)建集群模板
便捷集成 EMR Studio采用半托管的部署形態(tài),您可以直接登錄集群靈活操作和部署軟件,可以將EMR Studio集成至已有系統(tǒng)。EMR Studio作為一款云上產品,支持與數(shù)據(jù)湖構建(DLF)和對象存儲(OSS)等云上產品對接,構建云原生大數(shù)據(jù)產品架構。您可以在創(chuàng)建EMR Studio時指定OSS bucket路徑,EMR Studio將自動備份作業(yè)代碼和作業(yè)日志,并可以通過該路徑提交Airflow DAG腳本。