日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

事件管理

更新時間:

事件是指任何可能中斷或降低服務質量(或具有此類威脅)的計劃外事件。例如業務出現風險、服務器運行緩慢、接口響應延時過高等一系列問題均屬于事件。它可能影響工作效率、降低客戶體驗,即使未造成嚴重后果,也應該歸類為事件。

事件來源一般分為:

  • 人工上報

  • 系統發現

事件管理是針對事件進行識別、記錄、分類、分派、分析、解決和完結的過程。事件管理的目標是及時、準確的接受時間,并進行服務回復。盡可能的減少業務影響。通過事件管理可以實現快速定位問題、提高解決效率、減少重復問題的發生頻率、增強業務連續性、提高用戶體驗、規范企業工作流程。

image.png

事件管理包括以下幾點:

  • 事件的識別與記錄:通過監控工具、日志分析、人工上報等方式發現事件,并將其記錄。

  • 事件分級與分類:根據事件的相關信息,可對事件進行分級、分類,便于進一步處理。

  • 分級:根據影響程度可分為:P1、P2、P3、P4。

  • 分類:根據發生原因可分為:監控誤報、業務波動、代碼邏輯等問題。

  • 事件處理人分派:可根據事件的影響面/服務/應用等相關信息,將事件分派至對應的人/群組。便于事件的快速響應與處理,同時提高內部信息的同步效率。

  • 事件解決與分析:事件處理人可查看報警詳細信息,對事件進行初步判斷與分析。并對事件進行響應與解決。在解決的同時需記錄解決方式與判斷條件等信息,便于后續發生同類事件的處理。

  • 事件完結:在處理完成相應事件時,需關閉此事件。事件記錄將被留存,在后續發生同類問題時可根據同類事件進行查看,并快速處理此列問題。

通過事件管理,建立標準的事件操作流程的優勢包括:

  • 快速解決事件。

  • 降低業務的損失與成本。

  • 持續改進與學習

運維事件中心是阿里云提供的云上事件管理服務。通過集成監控源告警數據,并按照規則條件分派預通知的,都可以被稱之為事件。事件比報警優先級更高,將強調分派到具體責任人,并持續跟進解決、歸檔記錄。

事件主要用于管理通過規則自動觸發或人工手動新增的事件任務,運維事件中心的事件管理支持靈活的任務流轉,關鍵事件優先響應、完結處理等操作以便提升關鍵任務的MTTA和MTTR;支持將影響惡化的事件一鍵升級為故障,實現事件全生命周期的在線化管理。

  • 集成告警數據:可集成多種告警源例如:ARMS、SLS、云監控、Prometheus、Dynatrace等數十種監控系統。同時支持自定義集成,可自動解析告警信息。

  • 事件分類與分派:首先維護服務、人員、服務組之間的關系。其次通過流轉規則將系統內接受的告警信息按影響的服務/應用進行分類,可按告警信息字段設置觸發事件規則,同時將自動按預先設置的流程將事件分派至對應的處理人或組。

  • 事件的處理與解決:事件處理人接受事件,并查看相應的告警詳細信息,初步分析告警原因。在事件處理時,可查看、參考相似事件的處理方式,以便于快速解決。同時支持在處理事件時進行內容記錄,便于后續的分析與參考。

  • 事件的完結與持續運營:當事件解決后,需完結事件。在完結時需對事件進行打標處理,填寫事件觸發原因、解決方案等信息。通過這些信息的匯聚,可在后期統一進行分析查看,協助后續類似事件發生的處理以及對系統架構的優化提供可靠依據。