本文介紹向量檢索服務DashVector的產品規格,以幫助用戶選擇貼合自身業務場景的實例規格。
實例類型
向量檢索服務DashVector當前支持四種實例(Cluster)類型,以支持不同的業務場景和需求:
性能型:適用于查詢QPS高、查詢延遲低的場景,同時性能型也是寫入效率最高的實例類型。對于高并發、大流量、低延遲場景,或對寫入效率有較高的要求的場景,可選擇性能型實例。
存儲型(推薦):存儲型相對于性能型有5倍的存儲容量優勢,能夠存儲和管理更多的向量數據,適用于大規模數據量的場景。存儲型實例同樣也具備優秀的技術指標,可滿足大部分場景需求,同時也是性價比最高的實例類型,推薦用戶選擇使用。
Serverless型:不限數據容量,基于用戶數據自動擴縮,按實際請求收費,適用于低頻QPS查詢(QPS<2),延遲不敏感等場景??傮w性能與存儲型實例接近。
免費試用:適用于測試、體驗場景,請勿用于線上生產環境。免費試用實例有效期為1個月,到期后可再次申請試用。免費實例有部分試用限制,詳情可參考約束與限制。
免費試用實例有效期為1個月,到期后免費試用實例將自動釋放,實例中的數據將被全部刪除并清空且不可恢復,為了保證實例可持續使用,請您于創建免費試用實例之后的30個自然日內將免費試用實例升級為付費實例。免費試用實例由于到期且沒有升級為付費實例而導致的數據被刪除的情況,阿里云將不承擔相關責任。
實例規格
向量檢索服務DashVector針對性能型和存儲型實例提供不同檔位的實例(Cluster)規格,不同規格的主要區別在于存儲容量的不同。Serverless實例與已有性能型和存儲型不同,無容量限制。
若您有更高規格需求,或有任何反饋、期望獲取更多技術支持,歡迎通過如下方式聯系我們:
官方釘釘群:25130022704
技術支持郵箱:dashvector@service.aliyun.com
存儲容量參考
實例類型 | 實例規格 | Doc容量參考(基于768維FP32向量數據) | Doc容量參考(基于1536維FP32向量數據) |
性能型 | P.small | 500,000 | 250,000 |
P.large | 1,000,000 | 500,000 | |
P.2xlarge | 2,000,000 | 1,000,000 | |
P.4xlarge | 4,000,000 | 2,000,000 | |
P.8xlarge | 8,000,000 | 4,000,000 | |
P.16xlarge | 16,000,000 | 8,000,000 | |
存儲型 | S.small | 2,500,000 | 1,250,000 |
S.large | 5,000,000 | 2,500,000 | |
S.2xlarge | 10,000,000 | 5,000,000 | |
S.4xlarge | 20,000,000 | 10,000,000 | |
S.8xlarge | 40,000,000 | 20,000,000 | |
S.16xlarge | 80,000,000 | 40,000,000 | |
Serverless型 | Serverless | 不限 | 不限 |
以上數據均已通過實際測試驗證,但僅供參考!
上述用于容量測試的Doc中不包含任何Fields,僅包含主鍵和向量數據,主鍵為從零開始自增正整數轉字符串。大部分實際生產場景中,Fields是不可或缺的,Fields數據同樣會占用存儲空間,從而導致實際存儲的Doc數低于上述表格。
檢索性能參考
實例類型 | 實例規格 | topk=10 | topk=100 | topk=250 | topk=1000 | ||||
QPS | RT_p99 | QPS | RT_p99 | QPS | RT_p99 | QPS | RT_p99 | ||
性能型 | P.large(基于1百萬768維FP32向量數據) | 962.6 | <30ms | 429.7 | <30ms | 387.5 | <45ms | 134.7 | <250ms |
存儲型 | S.large(基于5百萬768維FP32向量數據) | 297.6 | <30ms | 112.5 | <30ms | 107.4 | <50ms | 37.1 | <300ms |
以上數據為基于Cohere數據集實測結果,但由于不同數據集的數據分布對性能有影響,上述數據僅供參考。
上述用于性能測試的Doc中不包含任何Fields,僅包含主鍵和向量數據,主鍵為從零開始自增正整數轉字符串。
向量檢索服務DashVector會定時在后臺進行向量索引優化,通常在寫入完成后4小時完成,屆時性能達到最優狀態。
不同規格在寫滿數據情況下,QPS與上述表格中保持一致或更高,不因數據量的增加而下降。如,P.2xlarge規格,在寫滿2百萬768維FP32向量數據情況下,topk=100的QPS可達到600+。
副本數
向量檢索服務DashVector支持調整副本數,可選范圍為1-5。副本之間數據完全相同,副本數越大,可支持的QPS越高,呈線性關系。同時副本數越大,服務可用性越高,建議對可用性有較高要求的生產環境選擇>=2的副本數。
需要注意,副本數的增加和減少不會影響存儲容量,僅影響QPS和可用性。
Serverless實例無副本概念,由系統管理。