基本概念
本文主要介紹向量檢索服務(wù)的名詞釋義。
Client(客戶端)
Client(客戶端),是用戶用于連接DashVector服務(wù)端的基礎(chǔ)對象,相當(dāng)于關(guān)系型數(shù)據(jù)庫中的Connection。通過設(shè)置API_KEY即可完成Client對象的創(chuàng)建,即完成與DashVector服務(wù)端的連接。通過Client對象可進行Collection操作(如新建Collection、獲取Collection列表等)。
Cluster(實例)
Cluster(實例),是面向售賣的資源管理單位,相當(dāng)于關(guān)系型數(shù)據(jù)庫中的一個庫,我們提供了不同的實例產(chǎn)品規(guī)格以滿足用戶不同的業(yè)務(wù)需求。用戶可以通過控制臺進行Cluster管理操作(如創(chuàng)建Cluster、升配Cluster、釋放Cluster)等,在創(chuàng)建好的Cluster里,用戶可以進行后續(xù)的Collection、Partition等操作。
同一個賬戶支持創(chuàng)建多個Cluster,賬戶內(nèi)單個Cluster名稱唯一。
每個賬戶同一時間段僅能創(chuàng)建一個免費試用Cluster,免費試用Cluster到期或主動釋放后可以再次創(chuàng)建一個免費試用Cluster。
Collection(集合)
Collection(集合),是一個相同類型Doc組成的集合,相當(dāng)于關(guān)系型數(shù)據(jù)庫中的一張表。每個Collection必須使用唯一的名稱來標(biāo)識,通過名稱可唯一獲取Collection對象。Collection對象可進行各種Doc操作(如插入Doc、檢索Doc等)和Partition操作(如新建Partition等)。
Collection名稱在Cluster內(nèi)必須唯一,不允許兩個相同名稱的Collection同時存在。
付費Cluster最多支持創(chuàng)建32個支持Collection;免費Cluster最多支持創(chuàng)建2個Collection。
Partition(分區(qū))
Partition(分區(qū)),是指同一個Collection下的Doc可通過不同的Partition進行分區(qū)。各種Doc操作(如插入Doc、檢索Doc等)如若指定Partition,則該操作將限定在該指定的Partition內(nèi)進行。通過合理的Partition設(shè)置,可有效提升Doc操作的效率。
Doc(文檔)
Doc(文檔),是DashVector最基礎(chǔ)的數(shù)據(jù)單元,相當(dāng)于關(guān)系型數(shù)據(jù)庫中的一行數(shù)據(jù)。Doc包含以下屬性:id(主鍵)、vector(向量)、fields(key-value結(jié)構(gòu)的字段名和字段值)。Doc是插入Doc、更新Doc、插入或更新Doc操作的基礎(chǔ)輸入結(jié)構(gòu),同時也是檢索Doc和獲取Doc操作的輸出結(jié)構(gòu)。
Field(字段)
Field(字段),是組成Doc的基礎(chǔ)單位之一,每個Doc可具備多個Field,相當(dāng)于關(guān)系型數(shù)據(jù)庫中的列。
Vector(向量)
Vector(向量),Embedding Vector,非結(jié)構(gòu)化數(shù)據(jù)通過各種AI Embedding模型進行特征的提取,獲取到的多維數(shù)據(jù)。DashVector中,Vector作為Doc的基礎(chǔ)數(shù)據(jù)單位之一,用于描述各種非結(jié)構(gòu)化數(shù)據(jù)的特征。例如,[0.1, 0.2, 0.3, 0.4]
就是一個維度(dimension)為4的向量。
Sparse Vector(稀疏向量)
Sparse Vector(稀疏向量),稀疏向量是指大部分元素為0,僅少量元素非0的向量。在DashVector中,稀疏向量可用來表示詞頻等信息。例如,{1:0.4, 10000:0.6, 222222:0.8}
就是一個稀疏向量,其第1、10000、222222位元素(分別代表三個關(guān)鍵字)有非0值(代表關(guān)鍵字的權(quán)重),其他元素全部為0。
QPS(訪問頻次)
每秒能向DashVector服務(wù)的API發(fā)起的最大查詢請求次數(shù)。QPS越高,同一時段內(nèi)能夠處理的業(yè)務(wù)量越多。例如QPS為5時,則在1秒內(nèi)可以進行5次調(diào)用請求。
API-KEY
API-KEY是您訪問向量檢索服務(wù)(DashVector)的密鑰。DashVector通過API-KEY進行調(diào)用鑒權(quán)和計量計費,目前僅支持通過阿里云主賬號進行API-KEY管理,每個賬戶同時可擁有3個有效的API-KEY。
請妥善保存和使用API-KEY,如需進一步了解API-KEY有關(guān)的安全信息,請參考保護并正確使用API-KEY。