前綴查詢
前綴查詢(PrefixQuery)是通過指定前綴條件查詢索引中的數(shù)據(jù)。
功能概述
前綴查詢主要用于查找以特定字符串開頭的數(shù)據(jù)。使用PrefixQuery功能查詢數(shù)據(jù)時,您需要指定前綴值。
目前支持用于PrefixQuery的數(shù)據(jù)類型包括Keyword、FuzzyKeyword和Text。
Keyword類型:字符串基礎(chǔ)數(shù)據(jù)類型,在中大規(guī)模數(shù)據(jù)上執(zhí)行PrefixQuery等模糊查詢的性能較差,且性能會隨著數(shù)據(jù)規(guī)模增長而下降。
FuzzyKeyword類型:專門為PrefixQuery等模糊查詢功能優(yōu)化過的數(shù)據(jù)類型,在小、中、大規(guī)模數(shù)據(jù)上的查詢性能均會更好更穩(wěn)定,且性能基本不會隨著數(shù)據(jù)規(guī)模增長而下降。
Text類型:只要Text類型字段值分詞后的詞條中有詞條滿足前綴條件即可,但是,由于分詞存在不確定性,一般不會在Text類型上使用PrefixQuery。當前只是為了兼容性才支持此方式,請慎重使用。
接口
前綴查詢的接口為Search或者ParallelScan,具體的Query類型為PrefixQuery。
參數(shù)
參數(shù) | 說明 |
query | 設(shè)置查詢類型為PrefixQuery。 |
fieldName | 要匹配的字段。 |
prefix | 前綴值。 對于Text類型字段,只要分詞后的詞條中有詞條滿足前綴條件即可。 |
getTotalCount | 是否返回匹配的總行數(shù),默認為false,表示不返回。 返回匹配的總行數(shù)會影響查詢性能。 |
weight | 查詢權(quán)重,用于全文檢索場景中的score排序。查詢時指定列的算分權(quán)重,值越大,結(jié)果中分數(shù)的值會越大。取值范圍為正浮點數(shù)。 使用此參數(shù)不會影響返回的結(jié)果數(shù),只會影響返回的結(jié)果中的分數(shù)。 |
tableName | 數(shù)據(jù)表名稱。 |
indexName | 多元索引名稱。 |
columnsToGet | 是否返回所有列,包含returnAll和columns設(shè)置。 returnAll默認為false,表示不返回所有列,此時可以通過columns指定返回的列;如果未通過columns指定返回的列,則只返回主鍵列。 當設(shè)置returnAll為true時,表示返回所有列。 |
使用方式
您可以使用控制臺、命令行工具或者SDK進行前綴查詢。進行前綴查詢之前,您需要完成如下準備工作。
目前基于FuzzyKeyword類型的PrefixQuery只支持使用表格存儲SDK實現(xiàn)。
使用阿里云賬號或者使用具有表格存儲操作權(quán)限的RAM用戶進行操作。如果需要為RAM用戶授權(quán)表格存儲操作權(quán)限,請參見通過RAM Policy為RAM用戶授權(quán)進行配置。
使用SDK方式和命令行工具方式進行操作時,如果當前無可用AccessKey,則需要為阿里云賬號或者RAM用戶創(chuàng)建AccessKey。具體操作,請參見創(chuàng)建AccessKey。
已創(chuàng)建數(shù)據(jù)表。具體操作,請參見數(shù)據(jù)表操作。
已為數(shù)據(jù)表創(chuàng)建多元索引。具體操作,請參見創(chuàng)建多元索引。
使用SDK方式進行操作時,還需要完成初始化Client。具體操作,請參見初始化OTSClient。
使用命令行工具方式進行操作前,還需要完成下載并啟動命令行工具,然后配置接入實例信息并選擇要操作的表。具體操作,請參見下載命令行工具、啟動并配置接入信息和數(shù)據(jù)表操作。
進入索引管理頁簽。
登錄表格存儲控制臺。
在頁面上方,選擇資源組和地域。
在概覽頁面,單擊實例名稱或在操作列單擊實例管理。
在實例詳情頁簽下的數(shù)據(jù)表列表頁簽,單擊數(shù)據(jù)表名稱或在操作列單擊索引管理。
在索引管理頁簽,單擊目標多元索引操作列的搜索。
在查詢數(shù)據(jù)對話框,查詢數(shù)據(jù)。
系統(tǒng)默認返回所有列,如需顯示指定屬性列,關(guān)閉獲取所有列并輸入需要返回的屬性列,多個屬性列之間用半角逗號(,)隔開。
說明系統(tǒng)默認會返回數(shù)據(jù)表的主鍵列。
根據(jù)需要選擇邏輯操作符為And、Or或者Not。
當選擇邏輯操作符為And時,返回滿足指定條件的數(shù)據(jù)。當選擇邏輯操作符為Or時,如果配置了單個條件,則返回滿足指定條件的數(shù)據(jù);如果配置了多個條件,則返回滿足任意一個條件的數(shù)據(jù)。當選擇邏輯操作符為Not時,返回不滿足指定條件的數(shù)據(jù)。
選擇索引字段,單擊添加。
設(shè)置索引字段的查詢類型為前綴查詢(PrefixQuery)和輸入要查詢的值。
系統(tǒng)默認關(guān)閉排序功能,如需根據(jù)指定字段對返回結(jié)果進行排序,打開是否排序開關(guān)后,根據(jù)需要添加要進行排序的字段并配置排序方式。
系統(tǒng)默認關(guān)閉統(tǒng)計功能,如需對指定字段進行數(shù)據(jù)統(tǒng)計,打開是否統(tǒng)計開關(guān)后,根據(jù)需要添加要進行統(tǒng)計的字段和配置統(tǒng)計信息。
單擊確定。
符合查詢條件的數(shù)據(jù)會顯示在索引管理頁簽中。
通過命令行工具執(zhí)行search
命令使用多元索引查詢數(shù)據(jù)。更多信息,請參見多元索引。
目前命令行工具僅支持Keyword類型的PrefixQuery,不支持FuzzyKeyword類型。
執(zhí)行
search
命令使用search_index多元索引查詢表中數(shù)據(jù),并返回所有建立索引的列。search -n search_index --return_all_indexed
根據(jù)系統(tǒng)提示輸入查詢條件,示例如下:
{ "Offset": -1, "Limit": 10, "Collapse": null, "Sort": null, "GetTotalCount": true, "Token": null, "Query": { "Name": "PrefixQuery", "Query": { "FieldName": "col_keyword", "Prefix": "hangzhou" } } }
您可以通過Java SDK、Go SDK、Python SDK、Node.js SDK、.NET SDK和PHP SDK使用前綴查詢。此處以Java SDK為例介紹前綴查詢的使用。
實際使用時,不論是Keyword類型還是FuzzyKeyword類型,查詢語句是完全相同的,只是查詢列的類型不同。
以下示例用于查詢表中Col_Keyword列的值中前綴為"hangzhou"的數(shù)據(jù)。
/**
* 查詢表中Col_Keyword列中前綴為"hangzhou"的數(shù)據(jù)。
* @param client
*/
private static void prefixQuery(SyncClient client) {
SearchQuery searchQuery = new SearchQuery();
PrefixQuery prefixQuery = new PrefixQuery(); //設(shè)置查詢類型為PrefixQuery。
searchQuery.setGetTotalCount(true);
prefixQuery.setFieldName("Col_Keyword");
prefixQuery.setPrefix("hangzhou");
searchQuery.setQuery(prefixQuery);
//searchQuery.setGetTotalCount(true); //設(shè)置返回匹配的總行數(shù)。
SearchRequest searchRequest = new SearchRequest("<TABLE_NAME>", "<SEARCH_INDEX_NAME>", searchQuery);
//通過設(shè)置columnsToGet參數(shù)可以指定返回的列或返回所有列,如果不設(shè)置此參數(shù),則默認只返回主鍵列。
//SearchRequest.ColumnsToGet columnsToGet = new SearchRequest.ColumnsToGet();
//columnsToGet.setReturnAll(true); //設(shè)置為返回所有列。
//columnsToGet.setColumns(Arrays.asList("ColName1","ColName2")); //設(shè)置為返回指定列。
//searchRequest.setColumnsToGet(columnsToGet);
SearchResponse resp = client.search(searchRequest);
//System.out.println("TotalCount: " + resp.getTotalCount()); //打印匹配到的總行數(shù),非返回行數(shù)。
System.out.println("Row: " + resp.getRows());
}
計費說明
使用VCU模式(原預留模式)時,使用多元索引查詢數(shù)據(jù)會消耗VCU的計算資源。使用CU模式(原按量模式)時,使用多元索引查詢數(shù)據(jù)會消耗讀吞吐量。更多信息,請參見多元索引計量計費。
常見問題
相關(guān)文檔
多元索引查詢類型包括精確查詢、多詞精確查詢、全匹配查詢、匹配查詢、短語匹配查詢、前綴查詢、范圍查詢、通配符查詢、基于分詞的通配符查詢、多條件組合查詢、地理位置查詢、嵌套類型查詢、向量檢索介紹與使用和列存在性查詢,您可以選擇合適的查詢類型進行多維度數(shù)據(jù)查詢。
如果要對結(jié)果集進行排序或者翻頁,您可以使用排序和翻頁功能來實現(xiàn)。具體操作,請參見排序和翻頁。
如果要按照某一列對結(jié)果集做折疊,使對應類型的數(shù)據(jù)在結(jié)果展示中只出現(xiàn)一次,您可以使用折疊(去重)功能來實現(xiàn)。具體操作,請參見折疊(去重)。
如果要進行數(shù)據(jù)分析,例如求最值、求和、統(tǒng)計行數(shù)等,您可以使用Search接口的統(tǒng)計聚合功能或者SQL查詢來實現(xiàn)。具體操作,請參見統(tǒng)計聚合和SQL查詢。
如果要快速導出數(shù)據(jù),而不關(guān)心整個結(jié)果集的順序時,您可以使用ParallelScan接口和ComputeSplits接口實現(xiàn)多并發(fā)導出數(shù)據(jù)。具體操作,請參見并發(fā)導出數(shù)據(jù)。