您可以在這里方便、快速地針對不同向量檢索版實例及其報警指標、閾值配置報警規則。報警服務支持電話、短信兩種報警通知方式。
引擎監控報警
為了更加方便快捷的創建報警規則,向量檢索版提供了默認報警組(包含多種常見的報警規則)功能。
報警規則包含:數據切換延遲、索引變化率、ha3通用查詢耗時、查詢節點內存使用率、查詢節點cpu使用率、數據節點內存使用率、數據節點cpu使用率和數據節點磁盤使用率相關的報警, 目標集群為所有集群。用戶只需要添加報警通知人、報警方式并開啟報警即可使用。
報警規則列表
數據切換報警:
項目 | 報警指標 | 報警閾值 | 通知間隔 |
全量延遲 | opensearch.ha3suez.searcher.index.full_delay_hours | 自定義 | 5分鐘 |
批次延遲 | opensearch.ha3suez.searcher.index.batch_inc_delay_minutes | 15分鐘 | 5分鐘 |
引擎默認報警:
項目 | 報警指標 | 報警閾值 | 通知間隔 |
索引變化率 | opensearch.ha3suez.searcher.index.rate_of_change | WARNING:>20 CRITICAL:>20 | 5分鐘 |
數據節點cpu使用率 | opensearch.ha3suez.searcher.proc_cpu | WARNING:>60 CRITICAL:>80 | 5分鐘 |
ha3通用查詢耗時 | opensearch.ha3suez.qrs.basic.qrssessionlatencynormal | WARNING:>400 CRITICAL:>800 | 5分鐘 |
數據節點磁盤使用率 | opensearch.ha3suez.searcher.disk_use_ratio | WARNING:>80 CRITICAL:>90 | 5分鐘 |
查詢節點cpu使用率 | opensearch.ha3suez.qrs.proc_cpu | WARNING:>60 CRITICAL:>80 | 5分鐘 |
數據節點內存使用率 | opensearch.ha3suez.searcher.proc_mem_used_ratio | WARNING:>80 CRITICAL:>90 | 5分鐘 |
查詢節點內存使用率 | opensearch.ha3suez.qrs.proc_mem_used_ratio | WARNING:>80 CRITICAL:>90 | 5分鐘 |
更多監控指標參考:監控指標
開啟默認報警
在報警組列表頁,點擊默認報警按鈕,并在彈出框點擊確認:
找到新創建好的默認報警,點擊報警規則列表按鈕:
3. 在報警規則列表頁面點擊開啟按鈕:
用戶也可以點擊修改報警規則按需修改默認報警的閾值、通知間隔、通知人和通知方式:
僅支持創建一個向量檢索版默認報警
自定義報警組
創建報警組
登錄開放搜索-向量檢索版控制臺,單擊頁面左側菜單欄報警管理>報警組列表,點擊創建報警組:
在創建報警組彈框中填寫報警組名稱以及備注信息,單擊完成即可(也可以點擊完成并添加報警規則,后續步驟參考新建報警規則):
新建報警規則
1.在報警組列表頁,單擊新建報警規則:
2.在新建報警規則彈出框中填寫報警規則名稱、選擇報警指標、目標集群(實例id)、填寫報警閾值、選擇報警通知間隔,最后選擇好對應的通知人(若沒有可選的通知人需先創建聯系人管理)以及通知方式(短信或電話),確認無誤后點擊創建即可。
3.配置好報警規則之后,點擊開啟按鈕,再點擊確定按鈕即可。
查看報警規則
1.在報警組列表頁,單擊查看報警規則,即可在報警規則列表彈窗中查看該報警組下的報警規則,并且支持新建、修改、復制、刪除、關閉(可按指定時間)報警規則功能,操作完成之后,點擊確認即可:
刪除報警組
1.在報警組列表頁,單擊刪除,會彈出是否確認刪除的提示框,點擊確認即可刪除該報警組。(該報警組中的所有報警規則也會被刪除,請謹慎操作)。