日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

使用硬件DSA進行數據流加速

英特爾?DSA(Data Streaming Accelerator)數據流加速器是一種高性能的數據拷貝和數據轉換加速器,已集成在八代神龍SPR機型的處理器中。ack-koordinator對已集成DSA硬件的節點,將自動開啟DSA加速功能,用于優化DRAM、持久內存和各種數據處理進程中常見的數據流拷貝和轉換。本文介紹如何使用硬件DSA進行數據流加速。

索引

前提條件

  • 已創建ACK Pro集群,且集群版本為1.18及以上版本。具體操作,請參見創建Kubernetes托管版集群

  • 已通過kubectl連接Kubernetes集群。具體操作,請參見獲取集群KubeConfig并通過kubectl工具連接集群

  • 已安裝ack-koordinator組件(原ack-slo-manager),且組件版本為v1.2.0-ack1.2及以上版本。關于安裝ack-koordinator組件的具體操作,請參見ack-koordinator(ack-slo-manager)

    說明

    ack-koordinator適配了原resource-controller組件的所有功能。如果您正在使用resource-controller,請您先卸載resource-controller,再安裝ack-koordinator。關于卸載組件的具體操作,請參見卸載resource-controller

  • 已確保多NUMA機型為神龍裸金屬ecs.ebmc、ecs.ebmg、ecs.ebmgn、ecs.ebmr、ecs.ebmhfc、ecs.scc等五、 六、七、八代機型。

    說明

    內存就近訪問加速功能尤其對ecs.ebmc8i.48xlarge、ecs.c8i.32xlarge、ecs.g8i.48xlarge的八代機型提供更好的支持。關于ECS實例規格族,請參見ECS實例規格

費用說明

ack-koordinator組件本身的安裝和使用是免費的,不過需要注意的是,在以下場景中可能產生額外的費用:

  • ack-koordinator是非托管組件,安裝后將占用Worker節點資源。您可以在安裝組件時配置各模塊的資源申請量。

  • ack-koordinator默認會將資源畫像、精細化調度等功能的監控指標以Prometheus的格式對外透出。若您配置組件時開啟了ACK-Koordinator開啟Prometheus監控指標選項并使用了阿里云Prometheus服務,這些指標將被視為自定義指標并產生相應費用。具體費用取決于您的集群規模和應用數量等因素。建議您在啟用此功能前,仔細閱讀阿里云Prometheus計費說明,了解自定義指標的免費額度和收費策略。您可以通過賬單和用量查詢,監控和管理您的資源使用情況。

DSA加速功能的優勢

八代Intel機型處理器集成了英特爾?DSA硬件,并基于Alinux 3增加了相關驅動。在此機型中安裝ack-koordinator組件,容器化自適應開啟DSA加速功能,將相關內存操作從CPU卸載至DSA硬件,實現數據拷貝和轉換的加速,并有效緩解過程中的CPU抖動。DSA加速功能更多優勢如下。

  • 提升節點上數據密集型工作負載的數據處理效能,優化OS內核中內存均衡、規整等的內存操作,提升整機內存的性能。

  • 對于ack-koordinator的內存就近訪問加速功能,DSA可以明顯提升單次處理的速度,有效降低CPU核時。遠端內存使用量越大,加速效果越明顯,十萬級到百萬級內存頁有30%~200%的速度提升和CPU節省。遷移約1.7 GB應用內存至本地,與無DSA硬件相比,遷移耗時降低至31.25%,帶寬提升至320.00%。

    重要

    本文中提供的測試數據僅為理論值(參考值),實際數據以您的操作環境為準。

    image

關于DSA更多信息,請參見Intel官方文檔

使用DSA加速功能

ack-koordinator組件對已集成DSA硬件的節點,將自動開啟DSA加速功能,您只需在集群中部署該組件即可使用DSA加速功能,無需額外配置。關于ack-koordinator的內存就近訪問加速功能,請參見多NUMA機型的容器內存就近訪問加速

驗證DSA加速功能

內存就近訪問加速功能以數據安全的方式將綁核應用遠端NUMA上的內存遷移至本地,提高本地訪存命中率,為內存密集型的工作負載提供更好的訪存性能。

測試環境

DSA加速功能測試需要多NUMA架構機型,例如ecs.ebmc8i.48xlarge、ecs.c8i.32xlarge、ecs.g8i.48xlarge等。本文選用測試機型為ecs.ebmc8i.48xlarge。

測試步驟

  1. 登錄測試節點,執行以下指令,確認處理器已集成DSA硬件。

    ls /sys/bus/dsa

    預期輸出無報錯且目錄非空,表明處理器已集成DSA硬件。

  2. 部署測試應用,并為其開啟內存就近訪問加速功能。

    推薦使用內存密集型應用Redis。

測試結論

對26.12 GB Redis遠端內存進行就近訪問加速所需的遷移時間,與CPU消耗(百萬級內存頁數)對比如下表所示。

測試場景

遷移時間(s)

CPU使用率

核時(s)

關閉DSA加速功能

9.649

1.000

9.649

開啟DSA加速功能

4.928

0.668

3.292

結果說明:在DSA加速功能觸發的內存遷移中,實際耗時降低至51.8%,平均CPU消耗降低至66.8%,所需核時降低至34.1%。DSA可以提升內存遷移的速度,并降低CPU消耗。