EMR Serverless Spark已接入云監控平臺,您可以通過事件訂閱對重要的事件設置定制化的報警通知,讓您及時了解事件的發生與進展,幫助您實時掌握事件動態,便于您在業務故障時快速分析并定位問題。
背景信息
云監控(CloudMonitor)是針對阿里云資源和互聯網應用提供監控的服務,支持集中管理、監控各云服務的系統事件,為您提供各云服務系統事件的統一查詢入口,使您及時了解各云服務的運行狀態,并接收報警通知。關于云監控的更多信息,請參見什么是云監控。
所有系統事件均可以通過云監控配置報警規則,當事件發生時會及時報警。云監控支持以下兩種報警方式:
通過短信、郵件、釘釘機器人等方式,對事件發生時進行報警。
將事件分發到您的消息隊列、日志服務、函數計算、Webhook中,以便您根據業務場景自動化處理異常事件。
前提條件
工作流已啟動執行,詳情請參見管理工作流。
創建訂閱策略
目前支持任務運行成功、任務運行失敗和任務正在運行三種類型的事件訂閱 ,本文以訂閱任務運行失敗事件為例。
工作流的狀態變更事件可能不會立即在云監控頁面上顯示出來。通常情況下,會存在幾分鐘的延遲,請您耐心等待。
獲取事件資源ID。
登錄云監控控制臺。
在左側導航欄,選擇 。
在事件監控頁簽,產品選擇E-MapReduce、事件名稱選擇EMRSpark工作流任務狀態變化,單擊搜索。
在下面篩選出的事件中找到目標事件的資源ID。
資源格式為
acs:emr:cn-hangzhou:<阿里云主賬號ID>:resourceId/workspaceId/<workspaceId>#workflowDefinitionName/<workflowDefinitionName>#taskDefinitionName/<taskDefinitionName>
,您也可以使用這個格式直接拼接您的任務事件資源ID。
訂閱事件通知。
在左側導航欄,選擇 。
說明您還可以通過系統事件菜單創建訂閱策略,具體操作如下:
在左側導航欄,選擇
。在歡迎體驗新版事件中心區域,單擊立即創建。
在訂閱策略頁簽,單擊創建訂閱策略。
在創建訂閱策略頁面,設置訂閱策略的相關參數。
名稱:輸入訂閱策略名稱。
訂閱類型:選擇系統事件。
訂閱范圍:
產品:選擇E-MapReduce。
事件名稱:選擇EMRSpark工作流任務狀態變化。
事件內容:輸入toState: FAILED。
事件資源:輸入前一個步驟中獲取到的資源信息。
事件類型、事件等級和應用分組:均不設置。
合并降噪:使用默認值。
通知:創建通知配置,自定義通知方式使用默認通知方式。
創建通知配置時,請先輸入通知配置名稱,再選擇通知設置為直接設置通知組,然后選擇報警聯系組,最后單擊確定。
說明關于如何創建通知配置,請參見創建通知配置策略。
系統自動根據報警組中報警聯系人的通知方式發送報警通知,例如:報警聯系人中設置了手機號碼和郵箱,自定義通知方式使用默認通知方式,則報警聯系人只會收到報警電話、短信和郵件。
推送與集成:無需配置。
說明關于如何創建推送渠道,請參見創建推送渠道。
單擊提交。
調試事件訂閱
調試事件訂閱
創建系統事件訂閱后,您可以使用系統事件的調試功能,驗證系統事件報警規則中設置的信息是否能正常被觸發。
在訂閱策略頁簽,單擊調試事件訂閱。
在創建事件調試面板,產品選擇E-MapReduce,名稱選擇EMRSpark工作流任務狀態變化。
系統自動生成JSON格式的調試內容。
單擊確定。
系統提示操作成功,云監控自動根據訂閱策略中的通知方式給報警聯系人發送一條報警測試通知。
常見問題
如果有多個任務的告警,可以在事件資源中使用逗號(,)隔開。例如,acs:emr:cn-hangzhou:113545727984****:resourceId/workspaceId/w-3a81b561ddcb2****#workflowDefinitionName/wf_1#taskDefinitionName/pytest,acs:emr:cn-hangzhou:113545727984****:resourceId/workspaceId/w-3a81b561ddcb****#workflowDefinitionName/wf_2#taskDefinitionName/pi_test
。
在填寫事件內容時,可以用逗號(,)分隔條件,以便同時配置事件。例如,toState: FAILED, toState: SUCCESS
。
針對任務正在運行的事件,建議您將其與任務運行成功或任務運行失敗的事件分開注冊。這是因為任務正在運行的事件可能會多次觸發,從而增加了不必要的通知噪聲。通過將其分開注冊,您可以更有效地管理事件通知。