注冊集群中使用節點即時彈性功能可以幫助您即時地感知工作負載情況,根據實際情況自動地擴縮云上節點資源。工作負載因節點資源不足而無法調度時,節點即時彈性根據工作負載大小靈活地擴容節點,以滿足工作負載運行需求;當云上節點利用率較低時,節點即時彈性會周期性檢查出滿足縮容條件的云上節點進行釋放,節約云上運行成本。本文將為您介紹如何在注冊集群使用節點即時彈性能力。
前提條件
確認您的注冊集群的版本為v1.26及以上版本。
已獲得節點即時彈性白名單權限。如需使用,請提交工單并描述您的業務場景進行申請。
步驟一:開啟節點即時彈性功能
使用即時彈性伸縮功能前,您需要在節點池頁面開啟并配置集群自動彈性伸縮,使節點具備伸縮能力。配置時,請選擇節點伸縮方案為即時彈性。
登錄容器服務管理控制臺,在左側導航欄選擇集群。
在集群列表頁面,單擊目標集群名稱,然后在左側導航欄,選擇 。
在節點池頁面,單擊節點伸縮后方的去配置。
(可選)首次使用節點伸縮功能時,在節點伸縮配置面板中顯示前置檢查失敗,您需要按照頁面提示,為當前集群添加自動伸縮授權策略。如已授權(顯示前置檢查通過),請跳過該步驟。
在節點伸縮配置面板的前置檢查說明中,單擊AliyunCSManagedAutoScalerRole鏈接。
在云資源訪問授權頁面單擊同意授權。
在節點伸縮配置頁面,選擇節點伸縮方案為即時彈性,配置伸縮配置項,然后單擊確定。
實施彈性伸縮時,彈性組件會基于調度情況自動觸發擴容。您只需配置縮容條件。
配置項
說明
縮容閾值
啟用節點即時彈性的節點池中,單個節點的請求資源(Request)與單個節點資源容量的比值。
僅當該比值低于配置的閾值時,即節點的CPU和內存資源利用率均低于縮容閾值時,節點才有可能被縮容。
GPU 縮容閾值
GPU實例的縮容閾值。
僅當該比值低于配置的閾值時,即節點的CPU、內存和GPU資源利用率均低于GPU 縮容閾值時,GPU節點才有可能被縮容。
縮容觸發時延
從檢測到有縮容需求(達到縮容閾值)到實際執行縮容操作(縮容Pod數量)之間的時間間隔。單位:分鐘。默認值:10分鐘。
重要僅當滿足縮容閾值配置,且達到縮容觸發時延后,彈性組件才有可能執行節點縮容。
配置項
說明
Pod 終止超時時間
縮容節點時等待節點上Pod終止的最長時間。單位:秒。
Pod 最小副本數
節點縮容前每個ReplicaSet中允許的Pod最小數量。
是否開啟 Daemonset Pod 排水
開啟DaemonSet Pod排水后,節點縮容時會驅逐節點上的DaemonSet Pod。
跳過有 kube-system 命名空間下 Pod 所在節點
開啟后,當集群執行節點自動縮容操作時,可以忽略運行在kube-system命名空間下的Pod所在的節點,確保這些節點不受縮容的影響。
說明此功能對DaemonSet Pod和Mirror Pod不生效。
步驟二:配置開啟彈性的節點池
節點即時彈性的擴縮對象為開啟自動伸縮節點池的節點。因此,開啟節點即時彈性后,您還需要配置至少一個開啟了彈性的節點池。
新建一個開啟自動彈性伸縮的節點池。具體操作,請參見創建節點池。
配置已有節點池,為其開啟自動彈性伸縮功能。具體操作,請參見編輯節點池。
說明配置已有節點池時,請確保您的節點池未配置期望節點數。您可以在節點池列表進入節點池詳情頁面,在基本頁簽查看期望節點數是否為空,也可以調用DescribeClusterNodePoolDetail - 查詢節點池配置接口,查詢
desired_size
是否為nil
。
您需要在新建節點池或配置已有節點池時,自動伸縮配置項勾選開啟自動彈性伸縮。
(可選)步驟三:結果驗證
完成如上操作后,您便可以使用節點即時彈性功能。
此時,在節點池頁面,節點池列表將顯示已開啟自動伸縮的節點池。