日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

ack-kube-queue

ack-kube-queue是云原生AI套件提供的任務隊列組件,主要圍繞著Kube Queue任務隊列,結合調度器和Quota系統,提供隊列管理、優先級調度、使用彈性配額等功能,幫助您優化Kubernetes中的AI/ML工作負載和批處理工作負載的管理效率和調度性能。本文介紹ack-kube-queue組件的基礎信息、使用說明和變更記錄。

組件介紹

任務調度場景下,例如在AI/ML工作負載和批處理工作負載場景下,當Kubernetes集群中任務類型的工作負載數量較多、Pod數量較多時,調度器的負載性能會受到較大影響,不同用戶提交的作業之間也可能會相互干擾。任務隊列ack-kube-queue圍繞著Kube Queue任務隊列提供相關功能,旨在管理Kubernetes中的AI/ML工作負載和批處理工作負載。該組件允許系統管理員使用自定義隊列的作業隊列管理,以提高隊列的靈活性。結合Quota系統,ack-kube-queue自動優化了工作負載和資源配額管理,以便最大化利用集群資源。

使用說明

ack-kube-queue組件僅支持在ACK Pro版集群、ACK Serverless集群Pro版ACK Edge集群Pro版中安裝,且集群版本需為1.18及以上。

您可以在部署云原生AI套件時為集群安裝ack-kube-queue,也可以為已部署云原生AI套件的集群安裝ack-kube-queue。安裝完成后,您可以使用ack-kube-queue提供的相關功能,例如開啟阻塞隊列、嚴格優先級調度等。關于ack-kube-queue組件的安裝和使用,請參見使用任務隊列ack-kube-queue

變更說明

2024年01月

版本號

變更內容

變更時間

變更影響

v0.3.4

修復Block模式下刪除隊頭任務時偶爾導致隊頭阻塞的問題。

2024年01月04日

此次升級不會對業務造成影響。

2023年12月

版本號

變更內容

變更時間

變更影響

v0.3.3

新增通過環境變量設置全局阻塞隊列時將會全局刷新所有Queue的阻塞隊列模式。

2023年12月26日

此次升級不會對業務造成影響。

2023年09月

版本號

變更內容

變更時間

變更影響

v0.3.1

修復刪除QueueUnit時偶爾導致隊列錯誤的問題。

2023年09月13日

此次升級不會對業務造成影響。

v0.3.0

新增對在Queue中透出任務排隊序列信息。

2023年09月13日

此次升級不會對業務造成影響。

2023年08月

版本號

變更內容

變更時間

變更影響

v0.2.1

修復Template中的NodeSelector導致在Worker節點上無法調度的問題。

2023年08月31日

此次升級不會對業務造成影響。

v0.2.0

  • 新增支持通過Arena提交MPI Job排隊。

  • 新增支持Argo Workflow排隊。

  • 新增在ElasticQuotaTree中使用kube-queue/max-jobs作為資源名可以實現對同時出隊的Job數量進行限制。

  • 優化隊列出隊失敗時的日志提示。

2023年08月29日

此次升級不會對業務造成影響。

2023年07月

版本號

變更內容

變更時間

變更影響

v0.1.13

修復更新時缺少LastUpdateTime可能導致組件無法工作的問題。

2023年07月26日

此次升級不會對業務造成影響。

v0.1.12

新增隊列級別配置隊列阻塞功能開關,支持通過將extension中的timeout參數配置成0來關閉重新入隊功能。

2023年07月20日

此次升級不會對業務造成影響。

2023年06月

版本號

變更內容

變更時間

變更影響

v0.1.11

新增任務更新時同步更新Queueunit狀態。

2023年06月30日

此次升級不會對業務造成影響。

v0.1.10

kube-queue-controller、tf-operator-extension以及pytorch-operator-extension等組件新增支持ARM架構節點。

2023年06月14日

此次升級不會對業務造成影響。

2023年05月

版本號

變更內容

變更時間

變更影響

v0.1.9

新增支持長時間Pending任務重新入隊功能以及多隊列公平調度。若任務下屬的Pod由于拓撲調度約束、親和性約束、資源碎片等原因長時間無法調度,ack-kube-queue將進行任務回收,讓任務進入隊列重新調度,避免任務無效占用Quota,提升Quota利用效率。

2023年05月16日

此次升級不會對業務造成影響。

2023年04月

版本號

變更內容

變更時間

變更影響

v0.1.8

新增支持阻塞隊列模式以及嚴格優先級出隊功能。更多信息,請參見開啟阻塞隊列開啟嚴格優先級調度

2023年04月25日

此次升級不會對業務造成影響。

2023年03月

版本號

變更內容

變更時間

變更影響

v0.1.6

修復TFJOB不顯示State的問題。

2023年03月15日

此次升級不會對業務造成影響。

2023年02月

版本號

變更內容

變更時間

變更影響

v0.1.5

修復ack-kube-queue偶發的刪除任務失敗的問題。

2023年02月28日

此次升級不會對業務造成影響。

v0.1.4

修復ack-kube-queue偶發的queueUnit出隊后Used信息丟失的問題。

2023年02月14日

此次升級不會對業務造成影響。

2023年01月

版本號

變更內容

變更時間

變更影響

v0.1.3

修復ack-kube-queue偶發的丟失queueUnit的問題。

2023年01月12日

此次升級不會對業務造成影響。

v0.1.2

修復ack-kube-queue偶發的長時間無法出隊的問題。

2023年01月12日

此次升級不會對業務造成影響。

v0.1.1

新增支持多隊列版本。不同Quota下的任務將進入不同隊列排隊,避免阻塞。

2023年01月10日

此次升級不會對業務造成影響。

2022年10月

版本號

變更內容

變更時間

變更影響

v0.1.0

新增組件,首次發布。

2022年10月15日

首次發布。