高級監控報警服務為您所有區域的Elasticsearch集群提供全維度指標和日志監控分析服務,不僅為您提供了多個維度下的可視化監控數據,還支持您根據業務需要自定義監控大屏和報警規則。本文為您介紹如何使用日志報警功能配置報警。
前提條件
目前高級監控報警服務支持的地域包括:杭州、北京、上海、深圳、青島、張家口、成都、廣州、烏蘭察布、北京金融云、美國東部、美國西部、日本、印度尼西亞、中國香港,具體以控制臺為準。
已創建釘釘機器人,針對機器人配置了OK和Alerting關鍵詞,并且獲取到機器人webhook,具體操作參考通過釘釘群接收報警通知。
熟悉Grafana監控大屏的使用方法。詳細信息,請參見Grafana Dashboard。
使用限制
日志報警通知僅支持DingDing和Webhook兩種方式,不支持其他方式。
釘釘機器人中自定義關鍵詞必須是OK和Alerting,否則接收不到報警,如下圖。
指標數據不支持配置Grafana報警。
操作流程
步驟一:進入高級監控報警頁面
- 登錄阿里云Elasticsearch控制臺。
在左側導航欄,單擊高級監控報警。
步驟二:配置日志報警聯系人相關信息
在高級監控報警頁面的左側導航欄中,選擇 。
單擊配置日志報警,進入Grafana頁面。
單擊左側的圖標,選擇Notification channels。
單擊Add channel,參考如下說明配置通知渠道。
參數
說明
Name
自定義報警名稱。本操作中使用的樣例值為test。
Type
僅支持DingDing和Webhook提醒,不支持其他方式。本操作中使用的樣例值為DingDing。
Url
釘釘機器人Webhook路徑。
Message Type
消息類型,僅支持Link。
單擊Save,保存配置信息。
步驟三:配置日志報警規則
在高級監控報警頁面的左側導航欄中,選擇 。
單擊配置日志報警,進入Grafana頁面。
使用報警模板配置日志報警規則(日志報警模板不支持直接編輯)。
在Grafana頁面,單擊監控模板上的圖標。
在對話框中,單擊Export頁簽。
單擊View JSON。
單擊Copy to Clipboard,復制JSON模板。
單擊左側圖標,選擇Import。
在Import via panel json中,粘貼JSON模板中默認的報警規則。
單擊Load。
修改Name,并重新定義Unique identifier (uid)。
單擊Import,即可完成模板的導入。
調整報警規則。
以配置慢查詢耗時超閾值條數報警為例。
單擊慢查詢耗時超閾值條數,從下拉列表中選擇Edit。
單擊Query頁簽,設置查詢條件。當滿足該查詢條件時,將觸發報警檢測機制。
單擊Alert頁簽,設置Rule和Conditions。
說明系統默認報警規則為:每5分鐘執行一次Query條件,在每一個過去的5分鐘內,各時間點下慢查詢耗時超過1000ms的日志條數平均值大于10條,且該狀態持續超過1分鐘,則系統上報告警。
Evaluate every為檢測頻率,最小值可配置1分鐘,其他配置項無限制。
單擊Send to后的圖標,添加步驟二中已經配置好的日志報警聯系人。
單擊Save。
單擊Apply。
說明配置中未提及的項,可使用默認值,也可按需配置,更高階的報警配置可以參考Grafana官方文檔
步驟四:查看日志報警規則
在高級監控報警頁面的左側導航欄中,選擇 。
單擊配置日志報警,進入Grafana頁面。
單擊左側圖標,選擇Alert Rules,獲取報警規則列表。
您還可以通過
查看成功配置的報警大盤。