日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

主機可觀測

可觀測監控 Prometheus 版支持通過node-exporter采集ECS Linux或Windows主機操作系統相關指標,也支持process-exporter采集進程相關監控數據,另外基于textfile的方式也支持采集用戶寫到文件中自定義監控指標。

前提條件

主機監控優勢

阿里云Prometheus主機監控針對阿里云ECS服務器提供了一個高效且易于管理的監控方案,這一方案的特點是順應了現代云計算環境中對于可觀測性和自動化管理的需求。

阿里云Prometheus提供的主機監控,具備阿里云ECS服務器、自建IDC內服務器、云廠商服務器全類型主機接入能力。針對阿里云ECS服務器可根據配置自動安裝各類開源Exporter,各類Exporter采集配置自動生成。托管Prometheus Agent實現自動采集,采集數據統一存儲、統一展示、統一告警。非阿里云主機不具備自動服務發現的能力,所以需要依賴用戶在接入時手動安裝阿里云采集探針,主動將監控數據上報到阿里云Prometheus存儲。

image

優勢

說明

主機秒級發現

  • 適應性:自動服務發現機制允許監控系統快速適應云資源的動態變化,確保所有運行中的實例都被及時監控。

  • 多樣性:支持多種服務發現類型,滿足不同場景下的監控需求,例如支持Kubernetes集群內服務的自動發現,以及其他類型云服務的集成。

探針秒級安裝

  • 即插即用:自動化安裝Exporter,使得新啟動的計算節點可以立即被監控系統識別并收集其度量,無需人為干預。

  • 全面監控:提供多種Exporter,包括Node-exporter、Process-exporter、GPU-exporter和中間件Exporter,進行全方位的性能追蹤。

指標秒級采集

  • 配置簡化:自動化配置生成減輕了運維人員手動配置的負擔,確保所有節點和服務的指標都能被準確無誤地采集。

  • 靈活性:配置可根據現有的監控需求作出相應調整,帶來靈活性和可擴展性,應對復雜多變的監控環境。

主機從創建到納入監控系統,整體可以在30 ~ 60s以內完成。主機所有指標數據可以支持1 ~ 60s時間間隔的靈活調整。整體實現主機全方位秒級監控能力。

探針Serverless化

  • 集中管理:通過托管的Prometheus Agent統一管理數據采集,簡化監控架構,提高運維效率,且用戶對數據采集鏈路無感知。

  • 高效能:因為抽象了監控算法的復雜性,使用Agent可以減少誤配的可能性,提高監控數據的準確性和時效性。

智能指標標簽

  • 自動摘取阿里云ECS主機的標簽、資源組、區域等信息,并自動注入到整個指標體系中,方便快捷。

  • 可自定義添加額外標簽,進一步提升標簽體系的靈活性,例如自定義業務標識、環境標識、數據來源標識等。

超大規模數據采集與存儲

  • 支持超大規模主機接入,采用獨享與共享并存托管模式,依據主機接入規模動態調整托管資源,保證接入的時效性和準確性。

  • 存儲可支持超大規模指標存儲,并具備高性能的查詢和展示能力。

提供完善的上下游監控數據

  • 為了實現一個系統級的、全面的可觀測性,單一實體監控是不夠的,需要整合不同維度的監控數據并構建全鏈路觀測,確保監控系統能夠反映出整個應用和服務生態的健康和性能。

  • 涵蓋從底層硬件到應用層再到外部服務(例如RDMA網絡、OSS存儲、Redis等)的綜合監控策略,不僅包括對主機和網絡的監控,還包括對依賴服務的監控。

進程級監控

  • 進程級監控可以對操作系統運行的進程進行跟蹤和分析,以了解進程的性能和資源利用情況。這是實現系統級監控的關鍵部分,旨在提供運行在服務器上的應用程序的健康和表現的透視圖。

  • 進程級監控除了會捕獲進程的CPU使用率、進程的內存使用量、進程的磁盤讀寫情況等關鍵性能指標,還會收集進程的啟動時間、打開的文件的句柄數、進程下調起的線程數量等。提供接近于實時的監控能力,做到即時反饋,讓系統管理員能夠及時識別和解決問題。

  • 進程級監控為管理員提供更加豐富的故障診斷手段,幫助識別導致系統性能下降或故障的進程,例如可能是某些進程內存泄露、高CPU使用率或其他資源爭用等。

默認提供Grafana專家級大盤

  • 默認集成經過阿里云專家經驗沉淀的Grafana大盤,包括ECS Overview總覽大盤、ECS Detail詳細大盤、GPU Overview總覽大盤、GPU Detail詳細大盤、Node Process進程級大盤。

  • 真正做到一鍵接入主機可觀測,開箱即用。

步驟一:接入主機監控數據

  1. 登錄ARMS控制臺

  2. 在左側導航欄單擊接入中心。

  3. 接入中心頁面,單擊左側基礎設施,然后單擊主機監控

    image

    說明
    • 由于Prometheus依賴阿里云資源中心獲取云產品當前登錄賬戶的VPC、ECS等數據進行服務發現,如果沒有開通資源中心,接入流程會引導您先開通資源中心,具體操作請參見開通資源中心

    • 開通資源中心是異步操作,重新檢測后如果仍然是未開通狀態,可以等待10~20秒左右再單擊重新檢測。

  4. 在彈出的頁面中,選擇目標ECS(VPC),然后按照下表說明填寫配置信息。

    image

    指標

    說明

    NodeExporter 安裝方式

    • 自動安裝(推薦):Prometheus會為用戶選擇的ECS默認安裝node-exporter,您無需其他操作即可接入。

    • 自助安裝:自行安裝node-exporter。

    主機服務發現方式

    • 污點標簽選擇:黑名單機制。標簽匹配到的實例將不會接入Prometheus,沒有匹配到的ECS監控指標將會接入Prometheus,默認不會采集容器監控服務的節點。

    • 無條件:安裝和采集當前VPC內所有ECS主機監控指標。

    • 標簽選擇:白名單機制。標簽匹配到的實例將會接入Prometheus,沒有匹配到的ECS實例將不會接入Prometheus。

    • IP域選擇:該方式是提供一個網段,當ECS的IP地址匹配該網段時,即被選中。如果填寫VPC對應的網段,即代表命中當前VPC全部ECS。

    • 實例ID:指定需要接入的實例ID,多個實例ID使用英文逗號分隔。

    ECS 污點標簽

    每一個污點標簽由key和value組成,可以設置多個污點標簽。

    采集 TextFile

    采集指定文件中的Prometheus指標。

    采集進程狀態指標

    默認會采集主機上的進程監控數據。

    Node-Exporter 服務端口

    默認端口9100。

    Metric 采集間隔(單位/秒)

    采集數據的時間間隔,默認為15秒。

    自動配置安全組

    默認打開。

  5. 單擊確定,等待1~2分鐘即可完成ECS主機監控指標接入。

說明

接入成功后,如果監控大盤沒有數據,需要確認ECS的安全組在入方向需要允許100.64.0.0/10和192.168.0.0/18網段對9100和9256的訪問權限,查看ECS的安全組詳情,請參見查詢安全組。9100是node-exporter的默認端口,9256是process-exporter的默認端口,具體端口需要根據您自身配置進行調整。

步驟二:查看監控大盤

  1. 登錄ARMS控制臺。

  2. 在左側導航欄單擊接入管理

  3. 接入管理頁面的已接入環境頁簽中,選擇ECS環境。

  4. ECS環境列表中,單擊目標環境名稱進入ECS環境詳情頁面。

  5. 組件管理頁簽,單擊組件類型區域的大盤,即可查看內置的Grafana大盤。

步驟三:配置告警

  1. 登錄ARMS控制臺。

  2. 在左側導航欄單擊接入管理。

  3. 接入管理頁面的已接入環境頁簽中,選擇ECS環境。

  4. ECS環境列表中,單擊目標環境名稱進入ECS環境詳情頁面。

  5. 組件管理頁簽,單擊組件類型區域的告警規則,即可查看內置的告警規則。

說明
  • 內置的告警規則會產生告警事件,但不會進行告警通知。如果您希望將告警通知發送到郵件或其他平臺,可以單擊編輯配置通知方式。在告警配置頁面您也可以自定義告警閾值、持續時間、告警內容等,具體操作,請參見Prometheus告警規則。

  • 在極簡模式下,您可以設置告警的通知對象、通知時段和重復策略。

image

Grafana大盤圖例

ECS Overview大盤

image.png

ECS Detail大盤

image.png

Node Process進程大盤

image.png

GPU Overview大盤

image.png

GPU Detail大盤

image.png