實例健康診斷功能可以對實例的系統狀態、網絡狀態、磁盤狀態等進行全方位的診斷,幫助您了解實例的健康狀態,及時發現并解決常見的問題。

前提條件

如果問題場景為全面體檢或者實例網絡異常,請確保待檢測實例滿足以下條件:
  • 實例規格:屬于在售的實例規格族。更多信息,請參見實例規格族
    說明 已停售的實例規格族不支持實例健康診斷功能。
  • 實例狀態:處于運行中(Running)狀態。
  • 操作系統:如果您選擇的問題場景中會同時檢測實例操作系統內的配置,需要確保實例操作系統符合下表所述的條件。
    操作系統架構操作系統版本操作系統內配置
    x86_64位
    • Windows Server 2008及更高版本
    • Alibaba Cloud Linux 2/3
    • AlmaLinux 8.x
    • Anolis OS 7.x/8.x
    • CentOS 7.x/8.x
    • CentOS Stream 8
    • Debian 8.x/9.x/10.x/11.x
    • Fedora 33/34
    • OpenSUSE 15.x/42.x
    • Rocky Linux 8.x
    • SUSE Linux Enterprise Server 12.x/15.x
    • Ubuntu 16.04/18.04/20.04
    • Python版本:
      • Python 3.6~3.9
      • Python 2.7
    • 已安裝云助手Agent。具體操作,請參見安裝云助手Agent
    說明 表中未列出的操作系統發行版本均不支持,對于不支持的發行版本上的操作系統診斷運行效果不做保證。
如果問題場景為實例無法啟動,請確保待檢測實例狀態滿足以下條件:
  • 實例狀態:處于已停止(Stopped)狀態。
  • 操作系統:選擇的問題場景中會同時檢測實例操作系統內的配置,需要確保實例操作系統符合下表所述的條件。
    操作系統架構操作系統版本
    x86_64位
    • Alibaba Cloud Linux 2/3
    • AlmaLinux 8.x
    • Anolis OS 7.x/8.x
    • CentOS 7.x/8.x
    • CentOS Stream 8
    • Debian 8.x/9.x/10.x/11.x
    • Fedora 33/34/35
    • OpenSUSE 15.x/42.x
    • Rocky Linux 8.x
    • Red Hat Eneterprise Linux 7.x/8.x
    • SUSE Linux Enterprise Server 12.x/15.x
    • Ubuntu 16.04/18.04/20.04
    說明 表中未列出的操作系統發行版本均不支持,對于不支持的發行版本上的操作系統診斷運行效果不做保證。

背景信息

推薦您在以下場景中使用實例健康診斷功能了解實例健康狀態:
  • 定位解決問題:在操作實例過程中遇到問題,需要進行針對性的問題診斷以尋求修復方法,例如網絡連接不通。
  • 定期全面檢查:在日常運維中,需要全面了解實例整體的健康情況,以便及時發現并處理異常情況,避免影響業務。
說明 實例健康診斷功能為各診斷項提供了問題說明和修復建議,更多信息,請參見診斷項與診斷結果說明

創建實例診斷

  1. 登錄ECS管理控制臺
  2. 根據需要選擇一種方式開始診斷。
    • 自助問題排查頁面:
      1. 在左側導航欄,單擊自助問題排查
      2. 在頂部菜單欄左上角處,選擇地域。
      3. 單擊實例問題排查頁簽。
    • 實例頁面:
      1. 在左側導航欄,單擊實例與鏡像 > 實例
      2. 在頂部菜單欄左上角處,選擇地域。
      3. 找到待檢測實例,在對應操作列中選擇更多 > 運維和診斷 > 實例問題排查
    • 在單臺實例詳情頁面的健康診斷頁簽:
      1. 在左側導航欄,單擊實例與鏡像 > 實例
      2. 在頂部菜單欄左上角處,選擇地域。
      3. 找到待檢測實例,單擊實例ID。
      4. 單擊健康診斷頁簽。
      5. 單擊開始診斷
  3. 實例問題排查頁面,選擇問題類型、實例ID及時間范圍,然后單擊開始排查
    說明 同一臺實例只能同時存在一個進行中的診斷任務,且前后兩次診斷的時間間隔需要超過5分鐘。
    問題類型說明
    實例性能問題診斷ECS實例CPU負載高、內存負載高、帶寬負載高、磁盤BPS/IOPS高,或者實例性能受損等問題。
    實例無法連接或啟動異常診斷VNC無法遠程連接、SSH無法連接、實例處于運行狀態,實例操作系統無法啟動等問題。
    網絡問題診斷ECS實例的網絡性能受損,或者ping不通等問題。
    實例操作未生效診斷ECS實例的變更操作未生效問題,例如云盤擴容實際未生效。
    資源配額不足診斷ECS實例的資源配額是否達到上限,例如云盤容量配額不足、鏡像數量配額不足、彈性網卡創建數達到上限、安全組總數達到上限等問題。
    費用類問題診斷ECS實例購買、退款、續費、升降配、轉換計費方式等問題。
    安全風險檢測診斷ECS實例是否存在安全風險,例如系統漏洞、安全告警、惡意進程等。
    實例費用及安全行為審計對ECS實例狀態類、實例費用類、安全組相關等操作行為審計、追溯。
    說明 使用實例費用及安全行為審計診斷功能時需要擁有實例自助問題排查的關聯角色及權限。更多信息,請參見管理實例問題排查診斷服務的關聯角色
    其他問題直接輸入問題的詳情。

    具體的診斷項以頁面顯示為準,您可以在診斷報告中單擊診斷項詳情下的各頁簽查看具體的診斷項及其診斷進展。診斷過程大概需要幾分鐘,您可以在當前頁面查看進展及等待診斷報告,也可以關閉對話框后在診斷任務列表中查看診斷進展和報告。

  4. 查看診斷報告。
    診斷報告中包含以下信息:
    • 基本信息:包括資源ID、報告ID和診斷時間。
    • 診斷結果:如果各項檢查均正常,則顯示為通過。如果存在異常診斷項,則顯示具體的異常診斷項并提供相應的修復方案,您可以參考修復方案解決問題。
    • 診斷項詳情:包括各診斷項的結果,級別分為嚴重、警告和通過。
    說明 使用實例費用及安全行為審計診斷功能時,您還可以通過以下方式獲取更多信息:

    您可以基于診斷報告,自助解決對應問題。具體說明如下:

查看診斷歷史

如果想要了解實例的歷史健康情況,您可以查看實例的診斷歷史。

  1. 登錄ECS管理控制臺
  2. 根據需要選擇一種方式查看實例的診斷歷史。
    • 查看單臺實例的診斷歷史
      1. 在左側導航欄,選擇實例與鏡像 > 實例
      2. 在頂部菜單欄處,選擇地域。
      3. 找到待查看的實例,根據需要選擇一種方式查看該實例的診斷歷史。
        • 在實例對應操作列中選擇更多 > 運維和診斷 > 實例問題排查歷史
        • 單擊實例ID進入該實例的詳情頁面,單擊健康診斷頁簽。
    • 查看所有實例的診斷歷史
      1. 在左側導航欄,單擊自助問題排查
      2. 在頂部菜單欄處,選擇地域。
      3. 單擊實例問題排查頁簽,然后單擊查看歷史
      4. 檢測歷史頁面,單擊實例健康診斷頁簽,并輸入資源ID或報告ID,然后單擊search圖標。
    說明 在診斷歷史報告列表中,您可以單擊診斷狀態右側的篩選圖標,選擇相應的狀態進行篩選。
  3. 對于單條診斷歷史,您可以單擊查看報告查看報告內容,或者單擊重新診斷重新發起一次診斷。