報警通知合并
當同一個阿里云賬號的多個資源在同一報警規則和周期內同時報警時,為減少報警資源的消耗和冗余信息的干擾,云監控在第一條報警通知發出后,以一分鐘為周期對后續的報警通知進行合并發送。本文將介紹不同報警規則下的報警通知合并示例。
報警通知方式
報警通知合并影響的報警通知方式包括:電話、短信、郵件和釘釘機器人。報警通知合并后,不同報警通知方式的差異如下:
電話和短信僅展示第一條資源的詳細信息,其他資源的詳細信息需要通過短信中的鏈接跳轉云監控控制臺查看。
郵件和釘釘機器人僅展示前20條資源的詳細信息。
通過應用分組設置閾值報警規則
示例:創建報警規則test_cpu_alarm
,對應用分組testGroup
中的云服務器ECS實例的監控指標(Agent)Host.cpu.total(推薦)
進行監控,并將報警通知以短信、郵件和釘釘機器人的方式發送給報警聯系人組Alarm_Group
。應用分組testGroup
和報警聯系人組Alarm_Group
需要您提前創建。
登錄云監控控制臺。
在左側導航欄,單擊應用分組。
在應用分組頁簽,單擊應用分組名稱testGroup。
在目標應用分組的左側導航欄,單擊報警規則。
單擊創建報警規則。
在創建報警規則面板,選擇產品為云服務器ECS。
單擊添加規則,設置云服務器ECS實例的報警規則,然后單擊確定。
參數
示例
規則名稱
test_cpu_alarm
監控指標
(Agent)Host.cpu.total(推薦)
閾值
>=10%
報警級別
Warning
報警通知方式
短信+郵件+WebHook
選擇報警聯系人組為Alarm_Group,單擊確定。
報警規則設置完畢后,如果多個資源在同一周期內滿足報警規則,報警信息會自動合并。不同報警通知方式的通知信息如下:
短信
第一條報警通知是應用分組中第一條資源的報警信息。
一分鐘后,云監控將對其他相同時間段內多個資源的報警信息進行合并發送。短信只展示第一條資源的詳細信息,其他資源均需要登錄云監控控制臺查看。
郵件
第一條報警通知是應用分組中第一條資源的報警信息。
一分鐘后,云監控將對其他相同時間段內多個資源的報警信息進行合并發送。郵件只展示前20條資源的詳細信息。
釘釘機器人
第一條報警通知是應用分組中第一條資源的報警信息。
一分鐘后,云監控將對其他相同時間段內多個資源的報警信息進行合并發送。釘釘機器人只展示前20條資源的詳細信息。
通過報警服務為全部資源設置閾值報警規則
示例:創建報警規則test_cpu_alarm
,對云服務器ECS中全部資源的監控指標(Agent)Host.cpu.total(推薦)
進行監控,并將報警通知以短信、郵件和釘釘機器人的方式發送給報警聯系人組Alarm_Group
。
登錄云監控控制臺。
在左側導航欄,選擇 。
在報警規則頁面,單擊創建報警規則。
在創建報警規則面板,為云服務器ECS全部資源的指定監控指標設置報警規則和通知方式。
參數
示例
產品
云服務器ECS
資源范圍
全部資源
規則名稱
test_cpu_alarm
監控指標
(Agent)Host.cpu.total(推薦)
周期
1分鐘
閾值
最大值>=10%
報警持續周期
5個
報警級別
Warning
報警通知方式
短信+郵件+WebHook
報警聯系人組
Alarm_Group
單擊確認。
報警規則設置完畢后,如果多個資源在同一周期內滿足報警規則,報警信息會自動合并。不同報警通知方式的通知信息如下:
短信
第一條報警通知是應用分組中第一條資源的報警信息。
一分鐘后,云監控將對其他相同時間段內多個資源的報警信息進行合并發送。短信只展示第一條資源的詳細信息,其他資源均需要登錄云監控控制臺查看。
郵件
第一條報警通知是應用分組中第一條資源的報警信息。
一分鐘后,云監控將對其他相同時間段內多個資源的報警信息進行合并發送。郵件只展示前20條資源的詳細信息。
釘釘機器人
第一條報警通知是應用分組中第一條資源的報警信息。
一分鐘后,云監控將對其他相同時間段內多個資源的報警信息進行合并發送。釘釘機器人只展示前20條資源的詳細信息。
通過報警服務為目標實例設置閾值報警規則
示例:創建報警規則test_node_alert
,對云數據庫Redis集群版中目標實例r-bp1vfufnlnkt2c****-name(r-bp1vfufnlnkt2c****)
的監控指標Proxy單個請求的平均字節數
進行監控,并將報警通知以短信、郵件和釘釘機器人的方式發送給報警聯系人組Alarm_Group
。
登錄云監控控制臺。
在左側導航欄,選擇 。
在報警規則頁面,單擊創建報警規則。
在創建報警規則面板,為云數據庫Redis集群版的目標實例的指定監控指標設置報警規則和通知方式。
參數
示例
產品
Redis集群版
資源范圍
實例
地域
華東1(杭州)
實例
r-bp1vfufnlnkt2c****-name(r-bp1vfufnlnkt2c****)
規則名稱
test_node_alert
監控指標
Proxy單個請求的平均字節數
周期
1分鐘
閾值
平均值>=0 Byte
報警持續周期
5個
報警級別
Warning
報警通知方式
短信+郵件+釘釘機器人
報警聯系人組
Alarm_Group
單擊確認。
報警規則設置完畢后,如果多個資源在同一周期內滿足報警規則,報警信息會自動合并。不同報警通知方式的通知信息如下:
短信
第一條報警通知是目標實例全部節點中的第一個節點的報警信息。
一分鐘后,云監控將對其他相同時間段內目標實例的多個節點的報警信息進行合并發送。短信只展示第一個節點的詳細信息,其他節點均需要登錄云監控控制臺查看。
郵件
第一條報警通知是目標實例全部節點中的第一個節點的報警信息。
一分鐘后,云監控將對其他相同時間段內目標實例的多個節點的報警信息進行合并發送。郵件只展示前20個節點的詳細信息。
釘釘機器人
第一條報警通知是目標實例全部節點中的第一個節點的報警信息。
一分鐘后,云監控將對其他相同時間段內目標實例的多個節點的報警信息進行合并發送。釘釘機器人只展示前20個節點的詳細信息。
通過事件監控設置事件報警規則
示例:創建事件報警規則test_config_alarm
,對云數據庫Redis集群版中目標實例r-bp1vfufnlnkt2c****-name(r-bp1vfufnlnkt2c****)
的監控指標Proxy單個請求的平均字節數
進行監控,并將報警通知以郵件和釘釘機器人的方式發送給報警聯系人組Alarm_Group
。報警聯系人組Alarm_Group
需要您提前創建。
登錄云監控控制臺。
在左側導航欄,選擇 。
在事件監控頁簽,單擊另存為報警。
在創建/修改事件報警面板,為配置審計的系統事件設置報警規則和通知方式。
參數
示例
報警規則名稱
test_config_alarm
產品類型
配置審計
事件類型
Notification
事件等級
信息
事件名稱
配置項變更
資源范圍
全部資源
聯系人組
Alarm_Group
通知方式
Info(郵件+釘釘機器人)
單擊確定。
報警規則設置完畢后,如果多個資源在同一周期內滿足報警規則,報警信息會自動合并。不同報警通知方式的通知信息如下:
郵件
第一條報警通知是配置審計觸發的第一條事件的報警信息。
一分鐘后,云監控將對其他相同時間段內配置審計觸發的多個事件的報警信息進行合并發送。郵件只展示前20條事件的報警信息。
釘釘機器人
第一條報警通知是配置審計觸發的第一條事件的報警信息。
一分鐘后,云監控將對其他相同時間段內配置審計觸發的多個事件的報警信息進行合并發送。釘釘機器人只展示前20條事件的報警信息。