您可以在日志監(jiān)控中創(chuàng)建監(jiān)控項及其報警規(guī)則,并對該監(jiān)控項執(zhí)行修改和刪除操作。
前提條件
請確保您已在日志服務SLS中創(chuàng)建Project和Logstore。
具體操作,請參見快速入門。
請確保您已授權云監(jiān)控訪問日志服務SLS的權限。
具體操作,請參見授權日志監(jiān)控。
請確保您已購買日志監(jiān)控的數(shù)據(jù)處理量。
更多信息,請參見按量計費。
創(chuàng)建日志監(jiān)控項
云監(jiān)控已于2022年09月13日停止日志監(jiān)控、自定義監(jiān)控和自定義事件監(jiān)控服務。2022年09月13日前正在使用上述三個服務的用戶仍然可以在2024年09月13日前正常使用。 其他用戶如有相關產品需求,建議使用企業(yè)云監(jiān)控下業(yè)務監(jiān)控中的本地日志監(jiān)控、SLS日志監(jiān)控及自定義監(jiān)控服務,功能更靈活,價格更低。 更多信息,請參見管理本地日志的數(shù)據(jù)接入任務、管理SLS日志的監(jiān)控指標和上報自定義監(jiān)控數(shù)據(jù)。
登錄云監(jiān)控控制臺。
在左側導航欄,選擇
。在日志監(jiān)控頁面,單擊新建日志監(jiān)控。
在關聯(lián)資源頁面,設置日志服務相關參數(shù),單擊下一步。
參數(shù)
描述
地域
日志服務中日志項目(日志Project)所在地域。
日志Project
日志服務中日志項目的名稱。
日志Logstore
日志服務中日志庫的名稱。
在監(jiān)控項定義頁面,設置監(jiān)控項相關參數(shù),單擊下一步。
參數(shù)
描述
監(jiān)控項
監(jiān)控指標的名稱。
單位
監(jiān)控項的單位。
計算周期
監(jiān)控項的計算周期。單位:分鐘。取值:1、2、3、4、5、10、15、20、30、60。
統(tǒng)計方法
在計算周期內根據(jù)選定的統(tǒng)計方法對日志數(shù)據(jù)進行聚合處理。如果字段值是數(shù)值型,可以使用所有統(tǒng)計方法,否則只能使用計數(shù)和countps兩種聚合算法。取值:
計數(shù):計算統(tǒng)計周期內指定字段數(shù)值的個數(shù)。
求和:計算1分鐘內指定字段數(shù)值之和。
最大值:計算統(tǒng)計周期內指定字段數(shù)值的最大值。
最小值:計算統(tǒng)計周期內指定字段數(shù)值的最小值。
平均值:計算統(tǒng)計周期內指定字段數(shù)值的平均值。
countps:計算統(tǒng)計周期內指定字段求count后的每秒平均值。
sumps:計算統(tǒng)計周期內指定字段求sum后的每秒平均值。
distinct:去重后計算統(tǒng)計周期內指定字段出現(xiàn)的次數(shù)。
擴展字段
為統(tǒng)計方法中的結果提供四則運算功能,例如:在統(tǒng)計方法中配置了HTTP狀態(tài)碼請求總數(shù)TotalNumber和HTTP狀態(tài)碼大于499的請求數(shù)5xxNumber,則可以通過擴展字段計算出服務端的錯誤率:5xxNumber/TotalNumber*100。
日志篩選
對日志數(shù)據(jù)進行過濾,相當于SQL中的where條件,例如:Key為level,Value中需要監(jiān)控的關鍵字為ERROR,該參數(shù)設置為
level>=ERROR
。選擇過濾的日志字段名不能包含中文。
Group-By
對數(shù)據(jù)進行空間維度聚合,相當于SQL中的Group By。
根據(jù)指定的維度,對監(jiān)控數(shù)據(jù)進行分組。如果Group By不選擇任何維度,則根據(jù)聚合方法對全部監(jiān)控數(shù)據(jù)進行聚合。
關于Group By,請參見Group By子句。
Select SQL
將統(tǒng)計方法轉化成SQL語句,方便您理解數(shù)據(jù)的處理方式。
應用分組
應用分組的名稱。將該監(jiān)控項添加到指定應用分組中。
在報警設置頁面,設置報警規(guī)則相關參數(shù),單擊下一步。
參數(shù)
描述
規(guī)則名稱
報警規(guī)則的名稱。
規(guī)則描述
報警規(guī)則的主體。當監(jiān)控數(shù)據(jù)滿足指定報警條件時,觸發(fā)報警規(guī)則。
報警級別
報警通知方式。取值:
電話+短信+郵件+WebHook
短信+郵件+WebHook
郵件+WebHook
連續(xù)幾次超過閾值后報警
連續(xù)幾次超過閾值后,報警聯(lián)系人組中的聯(lián)系人會收到報警通知。取值:1、3、5、10、15、30、60、90、120、180。
通道沉默周期
報警發(fā)生后未恢復正常,間隔多久重復發(fā)送一次報警通知。取值:5分鐘、15分鐘、30分鐘、60分鐘、3小時、6小時、12小時、24小時。
監(jiān)控指標達到報警閾值時發(fā)送報警,如果監(jiān)控指標在通道沉默周期內持續(xù)超過報警閾值,在通道沉默周期內不會重復發(fā)送報警通知;如果監(jiān)控指標在通道沉默周期后仍未恢復正常,則云監(jiān)控再次發(fā)送報警通知。
生效時間
報警規(guī)則的生效時間,報警規(guī)則只在生效時間內才會檢查監(jiān)控數(shù)據(jù)是否需要報警。
報警回調
填寫公網可訪問的URL地址,云監(jiān)控會將報警信息通過POST或GET請求推送到該URL地址,目前僅支持HTTP協(xié)議。關于報警回調的設置方法,請參見使用閾值報警回調。
在創(chuàng)建結果頁面,單擊關閉。
修改日志監(jiān)控項
登錄云監(jiān)控控制臺。
在左側導航欄,選擇
。在日志監(jiān)控頁面,單擊目標監(jiān)控項對應操作列的編輯。
在關聯(lián)資源頁面,設置監(jiān)控項相關參數(shù),單擊下一步。
參數(shù)
描述
地域
日志服務中日志項目(日志Project)所在地域。
日志Project
日志服務中日志項目的名稱。
日志Logstore
日志服務中日志庫的名稱。
在監(jiān)控項定義頁面,設置監(jiān)控項相關參數(shù),單擊下一步。
參數(shù)
描述
單位
監(jiān)控項的單位。
計算周期
監(jiān)控項的計算周期。單位:分鐘。取值:1、2、3、4、5、10、15、20、30、60。
統(tǒng)計方法
在計算周期內根據(jù)選定的統(tǒng)計方法對日志數(shù)據(jù)進行聚合處理。如果字段值是數(shù)值型,可以使用所有統(tǒng)計方法,否則只能使用計數(shù)和countps兩種聚合算法。取值:
計數(shù):計算統(tǒng)計周期內指定字段數(shù)值的個數(shù)。
求和:計算1分鐘內指定字段數(shù)值之和。
最大值:計算統(tǒng)計周期內指定字段數(shù)值的最大值。
最小值:計算統(tǒng)計周期內指定字段數(shù)值的最小值。
平均值:計算統(tǒng)計周期內指定字段數(shù)值的平均值。
countps:計算統(tǒng)計周期內指定字段求count后的每秒平均值。
sumps:計算統(tǒng)計周期內指定字段求sum后的每秒平均值。
distinct:去重后計算統(tǒng)計周期內指定字段出現(xiàn)的次數(shù)。
擴展字段
為統(tǒng)計方法中的結果提供四則運算功能,例如:在統(tǒng)計方法中配置了HTTP狀態(tài)碼請求總數(shù)TotalNumber和HTTP狀態(tài)碼大于499的請求數(shù)5xxNumber,則可以通過擴展字段計算出服務端的錯誤率:5xxNumber/TotalNumber*100。
日志篩選
對日志數(shù)據(jù)進行過濾,相當于SQL中的where條件,例如:Key為level,Value中需要監(jiān)控的關鍵字為ERROR,該參數(shù)設置為
level>=ERROR
。選擇過濾的日志字段名不能包含中文。
Group-By
對數(shù)據(jù)進行空間維度聚合,相當于SQL中的Group By。
根據(jù)指定的維度,對監(jiān)控數(shù)據(jù)進行分組。如果Group By不選擇任何維度,則根據(jù)聚合方法對全部監(jiān)控數(shù)據(jù)進行聚合。
關于Group By,請參見Group By子句。
Select SQL
將統(tǒng)計方法轉化成SQL語句,方便您理解數(shù)據(jù)的處理方式。
應用分組
應用分組的名稱。將該監(jiān)控項添加到指定應用分組中。
在報警設置頁面,設置報警規(guī)則相關參數(shù),單擊下一步。
參數(shù)
描述
規(guī)則名稱
報警規(guī)則的名稱。
規(guī)則描述
報警規(guī)則的主體。當監(jiān)控數(shù)據(jù)滿足指定報警條件時,觸發(fā)報警規(guī)則。
報警級別
報警通知方式。取值:
電話+短信+郵件+WebHook
短信+郵件+WebHook
郵件+WebHook
連續(xù)幾次超過閾值后報警
連續(xù)幾次超過閾值后,報警聯(lián)系人組中的聯(lián)系人會收到報警通知。取值:1、3、5、10、15、30、60、90、120、180。
通道沉默周期
報警發(fā)生后未恢復正常,間隔多久重復發(fā)送一次報警通知。取值:5分鐘、15分鐘、30分鐘、60分鐘、3小時、6小時、12小時、24小時。
監(jiān)控指標達到報警閾值時發(fā)送報警,如果監(jiān)控指標在通道沉默周期內持續(xù)超過報警閾值,在通道沉默周期內不會重復發(fā)送報警通知;如果監(jiān)控指標在通道沉默周期后仍未恢復正常,則云監(jiān)控再次發(fā)送報警通知。
生效時間
報警規(guī)則的生效時間,報警規(guī)則只在生效時間內才會檢查監(jiān)控數(shù)據(jù)是否需要報警。
報警回調
填寫公網可訪問的URL地址,云監(jiān)控會將報警信息通過POST或GET請求推送到該URL地址,目前僅支持HTTP協(xié)議。關于報警回調的設置方法,請參見使用閾值報警回調。
在創(chuàng)建結果頁面,單擊關閉。
刪除日志監(jiān)控項
登錄云監(jiān)控控制臺。
在左側導航欄,選擇
。刪除日志監(jiān)控項。
單個刪除
先單擊目標監(jiān)控項對應操作列的圖標,然后單擊刪除。
在確認刪除日志監(jiān)控對話框,單擊確定。
批量刪除
先單擊目標監(jiān)控項前面的復選框,然后單擊左下角的批量刪除。
在確認刪除日志監(jiān)控對話框,單擊確定。