Alibaba Cloud Linux 3(內核版本5.10.60-9.al8.x86_64
開始)增加了內核統一異??蚣躑KFEF(Unified Kernel Fault Event Framework),用于統計可能導致風險的系統異常事件,并以統一格式輸出事件報告。本文主要介紹UKFEF所統計的事件、事件報告輸出形式以及控制UKFEF的接口。
背景信息
操作系統在出現嚴重問題前,可能會輸出一些特征或提示信息。在運維過程中,您可以利用這些信息進行故障預測和實施運維操作,但由于這些信息分散在系統中的不同模塊,且輸出格式各異。因此,您在收集系統異常事件時可能面臨以下問題:
解析系統異常事件(例如異常事件的含義、可能造成的影響等)需要一定的專業知識作為基礎。
不同格式的異常事件,對于自動化運維不友好,您需要在信息采集時做格式匹配,并需要做數據清洗。
基于以上問題,Alibaba Cloud Linux 3在操作系統內核層面提供了內核統一異??蚣埽║KFEF)。UKFEF針對各類可能導致風險的系統異常事件進行統計,并自動判斷事件的嚴重程度,然后統一格式輸出事件報告,報告包括了問題產生的場景以及建議的風險級別,從而簡化運維過程中對系統異常的識別難度。同時,UKFEF將已知異常事件進行分級,并提供了歷史內核版本不具備的系統風險報告。
UKFEF功能按照異常事件的類型、影響、統計等多個維度輸出報告,便于您在運維時高效地對系統異常進行診斷。此外,事件報告通過多種形式輸出,避免數據丟失。
事件說明
UKFEF劃分的事件類型、事件級別,以及事件報告形式的說明如下:
事件相關信息 | 說明 |
事件類型 | UKFEF統一收集以下操作系統內核常見事件:
|
事件級別 | UKFEF將異常事件分為三個級別:
|
事件報告 | UKFEF將通過以下方式輸出事件報告:
|
控制UKFEF的接口說明
接口 | 說明 |
| 該接口控制UKFEF的啟用與關閉。取值范圍:
|
| 該接口控制UKFEF是否輸出事件報告。取值范圍:
|
| 該接口控制出現Fatal事件時,是否觸發操作系統的Panic機制。取值范圍:
|