日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

內核統一異常框架(UKFEF)

Alibaba Cloud Linux 3(內核版本5.10.60-9.al8.x86_64開始)增加了內核統一異??蚣躑KFEF(Unified Kernel Fault Event Framework),用于統計可能導致風險的系統異常事件,并以統一格式輸出事件報告。本文主要介紹UKFEF所統計的事件、事件報告輸出形式以及控制UKFEF的接口。

背景信息

操作系統在出現嚴重問題前,可能會輸出一些特征或提示信息。在運維過程中,您可以利用這些信息進行故障預測和實施運維操作,但由于這些信息分散在系統中的不同模塊,且輸出格式各異。因此,您在收集系統異常事件時可能面臨以下問題:

  • 解析系統異常事件(例如異常事件的含義、可能造成的影響等)需要一定的專業知識作為基礎。

  • 不同格式的異常事件,對于自動化運維不友好,您需要在信息采集時做格式匹配,并需要做數據清洗。

基于以上問題,Alibaba Cloud Linux 3在操作系統內核層面提供了內核統一異??蚣埽║KFEF)。UKFEF針對各類可能導致風險的系統異常事件進行統計,并自動判斷事件的嚴重程度,然后統一格式輸出事件報告,報告包括了問題產生的場景以及建議的風險級別,從而簡化運維過程中對系統異常的識別難度。同時,UKFEF將已知異常事件進行分級,并提供了歷史內核版本不具備的系統風險報告。

UKFEF功能按照異常事件的類型、影響、統計等多個維度輸出報告,便于您在運維時高效地對系統異常進行診斷。此外,事件報告通過多種形式輸出,避免數據丟失。UKFEF

事件說明

UKFEF劃分的事件類型、事件級別,以及事件報告形式的說明如下:

事件相關信息

說明

事件類型

UKFEF統一收集以下操作系統內核常見事件:

  • soft lockup

  • RCU(Read-Copy Update) stall

  • hung task

  • global OOM(Out of Memory)

  • cgroup OOM(Out of Memory)

  • page allocation failure

  • list corruption

  • bad mm_struct

  • I/O error

  • EXT4-fs error

  • MCE(Machine Check Exception)

  • fatal signal

  • warning

  • panic

事件級別

UKFEF將異常事件分為三個級別:

  • Slight:不影響系統繼續運行,但系統內部署的業務可能發生抖動,您可以繼續觀察事件變化。

  • Normal:當前應用進程可能會出現異常。建議對當前應用采取措施,例如kill、重啟或遷移。

  • Fatal:可能會對系統產生致命影響。建議立即進行業務遷移。

事件報告

UKFEF將通過以下方式輸出事件報告:

  • 通過內核日志輸出單次事件的詳細信息。信息內容示例如下:

    class Fault event[module:type]:messages. At cpu cpuid, task pid(cmdline). Total fault: cnt

    具體說明如下:

    • class:對應異常事件的級別。

    • module:表示異常事件所屬的模塊(sched、mem、io、fs、net、hardware以及由多個模塊引起的異常會輸出general)。

    • type:對應異常事件的類型。

    • messages:事件自身的自定義消息。

    • cpuid:發生異常事件的CPU號。

    • pid(cmdline):異常事件對應進程的pid和cmdline。

      說明

      如果pid為-1,則表示沒有對應的進程。

    • cnt:表示系統啟動以來當前類型的異常事件出現的總和。

  • 通過/proc/fault_events文件輸出各類異常事件的總和。文件輸出內容示例如下:

    Total fault events: 0
    Slight: 0
    Normal: 0
    Fatal: 0
    soft lockup: 0
    rcu stall: 0
    hung task: 0
    global oom: 0
    cgroup oom: 0
    page allocation failure: 0
    list corruption: 0
    bad mm_struct: 0
    io error: 0
    ext4 fs error: 0
    mce: 0
    fatal signal: 0
    warning: 0
    panic: 0

控制UKFEF的接口說明

接口

說明

/proc/sys/kernel/fault_event_enable

該接口控制UKFEF的啟用與關閉。取值范圍:

  • 1:啟用UKFEF。

  • 0:關閉UKFEF。

/proc/sys/kernel/fault_event_print

該接口控制UKFEF是否輸出事件報告。取值范圍:

  • 1:輸出。

  • 0:不輸出。

/proc/sys/kernel/panic_on_fatal_event

該接口控制出現Fatal事件時,是否觸發操作系統的Panic機制。取值范圍:

  • 1:觸發。

  • 0:不觸發。