本教程以監控ECI實例的臨時存儲空間的利用率為例,介紹如何設置云監控的報警規則,以便及時獲取臨時存儲空間不足的實例信息,進而可以及時創建新的實例來替換,避免因存儲空間不足而導致數據無法寫入,影響業務運行。
背景信息
云監控支持監控ECI實例的CPU利用率、內存利用率、存儲空間容量等指標。基于這些指標,您可以設置報警規則,以便及時感知ECI實例的運行情況,并對異常實例進行處理。更多關于云監控支持的ECI監控指標,請參見使用云監控對ECI實例進行監控。
操作步驟
單擊創建報警規則。
在彈出面板完成報警規則配置,然后單擊確認。
需要注意的參數如下,未提及的參數可保持默認配置。更多關于報警規則的配置說明,請參見創建報警規則。
參數
說明
產品
選擇彈性容器實例ECI。
資源范圍
報警規則作用的資源范圍。本教程選擇實例。
全部資源:報警規則作用于指定云產品的全部資源上,對于新加入的資源生效。
應用分組:報警規則作用于指定云產品的指定應用分組內的全部資源上,對于新加入的資源生效。
實例:報警規則作用于指定云產品的指定資源上。
關聯資源
當資源范圍選擇實例時,可指定具體的ECI實例。
單擊添加實例,在彈出的對話框中選擇要監控的ECI實例。
規則描述
單擊添加規則,選擇簡單指標,在彈出面板完成規則配置。
本教程采用的規則示例如下:
規則名稱:test
指標類型:簡單指標
監控指標:volume/存儲卷空間利用率
閾值及報警級別
緊急:連續3個周期(1周期=1分鐘),平均值≥90
警告:連續3個周期(1周期=1分鐘),平均值≥80
普通:連續3個周期(1周期=1分鐘),平均值≥70
維度:EphemeralVolume
關于如何設置復雜的報警條件,請參見報警規則表達式說明。
報警聯系人組
云監控默認將您的阿里云賬號添加為報警聯系人,并自動為其創建報警聯系組。
您也可以前往報警聯系人頁面創建新的報警聯系人和報警聯系人組。更多信息,請參見創建報警聯系人或報警聯系人組。
后續操作
創建報警規則后,如果規則中設置的監控指標達到了報警閾值,系統會自動給設置的聯系人發送通知。
短信通知示例如下:
您也可以在報警規則頁面找到目標規則,單擊報警歷史來查看報警情況。
收到報警通知后,請根據實際業務需求進行處理,例如:創建新的ECI實例并增加臨時存儲空間,以此來替換舊的存儲空間不足的ECI實例。
相關文檔
如果您通過Kubernetes集群使用ECI,可以為ECI Pod添加k8s.aliyun.com/eci-eviction-enable: "true"
的Annotation,實現在某一ECI Pod的臨時存儲空間不足(低于100 MiB)時,自動驅逐該Pod。具體操作,請參見設置自動驅逐臨時存儲空間不足的Pod。