模型部署支持根據GPU算力占比與顯存大小進行切分使用,提升資源利用率。
適用客戶
AIGC/AI推理/模型在線服務的客戶群。
新增功能/規格
EAS模型部署的過程中,支持客戶根據GPU算力占比與顯存大小進行切分使用,降低客戶資源成本,提升資源利用率。在部署頁面支持實例按顯存進行調度和按算力進行調度,實現單卡共享多實例功能。
產品文檔
文檔內容是否對您有幫助?
模型部署支持根據GPU算力占比與顯存大小進行切分使用,提升資源利用率。
AIGC/AI推理/模型在線服務的客戶群。
EAS模型部署的過程中,支持客戶根據GPU算力占比與顯存大小進行切分使用,降低客戶資源成本,提升資源利用率。在部署頁面支持實例按顯存進行調度和按算力進行調度,實現單卡共享多實例功能。