基于EAS&OpenSearch搭建RAG檢索增強(qiáng)對(duì)話系統(tǒng)
為了增強(qiáng)模型生成答案的準(zhǔn)確性和信息豐富度,您可以在大模型RAG服務(wù)中集成OpenSearch向量檢索版產(chǎn)品。該產(chǎn)品支持多種向量檢索算法,高性能支持多種典型場(chǎng)景,并提供圖形化界面,您可以查看索引信息并實(shí)現(xiàn)簡單的數(shù)據(jù)管理功能。通過集成OpenSearch向量檢索版產(chǎn)品,可以提升RAG對(duì)話系統(tǒng)的檢索效率和用戶體驗(yàn)。本文將介紹如何在部署RAG服務(wù)時(shí)關(guān)聯(lián)OpenSearch向量檢索版產(chǎn)品,以及對(duì)RAG對(duì)話系統(tǒng)的基礎(chǔ)功能和OpenSearch向量檢索版的特色功能進(jìn)行說明。
背景信息
EAS簡介
EAS(Elastic Algorithm Service)是PAI的模型在線服務(wù)平臺(tái),支持將模型部署為在線推理服務(wù)和AI-Web應(yīng)用。EAS提供了彈性擴(kuò)縮容和藍(lán)綠部署等功能,可以支撐您以較低的資源成本獲取高并發(fā)且穩(wěn)定的在線算法模型服務(wù)。此外,EAS具備資源組管理和版本控制等功能,并且有完整運(yùn)維監(jiān)控體系等能力。更詳細(xì)的內(nèi)容介紹,請(qǐng)參見EAS模型服務(wù)概述。
RAG簡介
隨著AI技術(shù)的飛速發(fā)展,生成式人工智能在文本生成、圖像生成等領(lǐng)域展現(xiàn)出了令人矚目的成就。然而,在廣泛應(yīng)用大語言模型(LLM)的過程中,一些固有局限性逐漸顯現(xiàn):
領(lǐng)域知識(shí)局限:大語言模型通常基于大規(guī)模通用數(shù)據(jù)集訓(xùn)練而成,難以針對(duì)專業(yè)垂直領(lǐng)域提供深入和針對(duì)性處理。
信息更新滯后:由于模型訓(xùn)練所依賴的數(shù)據(jù)集具有靜態(tài)特性,大模型無法實(shí)時(shí)獲取和學(xué)習(xí)最新的信息與知識(shí)進(jìn)展。
模型誤導(dǎo)性輸出:受制于數(shù)據(jù)偏差、模型內(nèi)在缺陷等因素,大語言模型可能會(huì)出現(xiàn)看似合理實(shí)則錯(cuò)誤的輸出,即所謂的“大模型幻覺”。
為克服這些挑戰(zhàn),并進(jìn)一步強(qiáng)化大模型的功能性和準(zhǔn)確性,檢索增強(qiáng)生成技術(shù)RAG(Retrieval-Augmented Generation)應(yīng)運(yùn)而生。這一技術(shù)通過整合外部知識(shí)庫,能夠顯著減少大模型虛構(gòu)的問題,并提升其獲取及應(yīng)用最新知識(shí)的能力,從而實(shí)現(xiàn)更個(gè)性化和精準(zhǔn)化的LLM定制。
OpenSearch簡介
阿里云OpenSearch向量檢索版,是一款全托管的大規(guī)模分布式向量檢索產(chǎn)品,支持多種向量檢索算法,高精度下性能表現(xiàn)優(yōu)異,能完成海量數(shù)據(jù)下的高性價(jià)比向量索引構(gòu)建和相似度檢索服務(wù),支持索引水平拓展與合并、索引流式構(gòu)建,數(shù)據(jù)能夠做到實(shí)時(shí)動(dòng)態(tài)更新,即增即查。
阿里云OpenSearch向量檢索版可以高性能支持多種向量檢索典型場(chǎng)景,如:RAG檢索增強(qiáng)生成、多模態(tài)檢索、個(gè)性化搜推等。更詳細(xì)的內(nèi)容介紹,請(qǐng)參見OpenSearch向量檢索版介紹。
使用流程
EAS自建了RAG系統(tǒng)化解決方案,提供了靈活可調(diào)的參數(shù)配置,您可以通過WebUI或者API調(diào)用RAG服務(wù),定制自己專屬的對(duì)話系統(tǒng)。RAG技術(shù)架構(gòu)的核心為檢索和生成:
在檢索方面,EAS支持多種向量檢索庫,包括開源的Faiss和阿里云的Milvus、Elasticsearch、Hologres、OpenSearch以及RDS PostgreSQL。
在生成方面,EAS支持豐富的開源模型,例如通義千問、Llama、Mistral、百川等,同時(shí)支持ChatGPT調(diào)用。
本方案以O(shè)penSearch為例,為您介紹如何使用EAS與阿里云OpenSearch向量檢索版構(gòu)建一個(gè)大模型RAG對(duì)話系統(tǒng)。整體流程大約花費(fèi)20分鐘,具體流程如下:
首先創(chuàng)建OpenSearch向量檢索版實(shí)例,并準(zhǔn)備部署RAG服務(wù)關(guān)聯(lián)該實(shí)例時(shí)依賴的配置項(xiàng)。
部署RAG服務(wù)并關(guān)聯(lián)OpenSearch
在EAS模型在線服務(wù)平臺(tái)部署RAG服務(wù),并關(guān)聯(lián)OpenSearch向量檢索版實(shí)例。
您可以在RAG對(duì)話系統(tǒng)中連接OpenSearch,上傳業(yè)務(wù)數(shù)據(jù)文件,并進(jìn)行知識(shí)問答。
前提條件
已創(chuàng)建專有網(wǎng)絡(luò)VPC、交換機(jī)和安全組。具體操作,請(qǐng)參見搭建IPv4專有網(wǎng)絡(luò)和創(chuàng)建安全組。
注意事項(xiàng)
本實(shí)踐受制于LLM服務(wù)的最大Token數(shù)量限制,旨在幫助您體驗(yàn)RAG對(duì)話系統(tǒng)的基本檢索功能:
該對(duì)話系統(tǒng)受制于LLM服務(wù)的服務(wù)器資源大小以及默認(rèn)Token數(shù)量限制,能支持的對(duì)話長度有限。
如果無需進(jìn)行多輪對(duì)話,建議您在RAG服務(wù)的WebUI頁面關(guān)閉with chat history功能,這樣能有效減少達(dá)到限制的可能性。詳情請(qǐng)參見如何關(guān)閉RAG服務(wù)的with chat history功能。
準(zhǔn)備向量檢索庫OpenSearch
步驟一:創(chuàng)建OpenSearch向量檢索版實(shí)例
進(jìn)入OpenSearch控制臺(tái),在左上角切換到OpenSearch-向量檢索版:
在實(shí)例列表頁面,創(chuàng)建OpenSearch向量檢索版實(shí)例。其中關(guān)鍵參數(shù)配置如下,更多配置說明,請(qǐng)參見購買OpenSearch向量檢索版實(shí)例。
參數(shù)
描述
商品版本
選擇向量檢索版。
專有網(wǎng)絡(luò)
選擇已創(chuàng)建的專有網(wǎng)絡(luò)和交換機(jī)。
虛擬交換機(jī)
用戶名
OpenSearch向量檢索實(shí)例的用戶名。
用戶密碼
OpenSearch向量檢索實(shí)例的密碼。
步驟二:準(zhǔn)備配置項(xiàng)
1.準(zhǔn)備實(shí)例ID
在實(shí)例列表頁面,查看OpenSearch向量檢索版的實(shí)例ID,并保存到本地。
2.準(zhǔn)備索引表
實(shí)例創(chuàng)建成功后,會(huì)進(jìn)入待配置狀態(tài)。您需要為該實(shí)例配置表基礎(chǔ)信息>數(shù)據(jù)同步>字段配置>索引結(jié)構(gòu),之后等待索引重建完成即可正常搜索。具體操作步驟如下:
單擊待配置實(shí)例操作列下的配置。
進(jìn)行表基礎(chǔ)信息配置,參數(shù)配置完成后,單擊下一步。
其中關(guān)鍵參數(shù)說明如下,其他參數(shù)配置說明,請(qǐng)參見通用版快速入門。
表名稱:自定義索引表名稱。
數(shù)據(jù)分片數(shù):如果您購買了查詢節(jié)點(diǎn),則在分片數(shù)設(shè)置時(shí),可配置為不超過256的正整數(shù), 用于提升全量構(gòu)建速度、單次查詢性能。如果未購買查詢節(jié)點(diǎn),則數(shù)據(jù)分片數(shù)只能配置為1。
數(shù)據(jù)更新資源數(shù):數(shù)據(jù)更新所用資源數(shù),每個(gè)索引默認(rèn)免費(fèi)提供2個(gè)4核8G的更新資源,超出免費(fèi)額度的資源將產(chǎn)生費(fèi)用,詳情可參考向量檢索版計(jì)費(fèi)概述
場(chǎng)景模板:選擇通用模板。
進(jìn)行數(shù)據(jù)同步配置,參數(shù)配置完成后,單擊下一步。
其中全量數(shù)據(jù)來源支持三種數(shù)據(jù)源方式,您可以根據(jù)具體業(yè)務(wù)情況進(jìn)行選擇:
MaxCompute+API:使用MaxCompute進(jìn)行數(shù)據(jù)全量寫入,實(shí)時(shí)數(shù)據(jù)通過API寫入。使用該方式時(shí),具體參數(shù)配置說明,請(qǐng)參見MaxCompute + API 數(shù)據(jù)源。
對(duì)象存儲(chǔ)OSS+API:使用OSS進(jìn)行數(shù)據(jù)全量寫入,實(shí)時(shí)數(shù)據(jù)通過API寫入。使用該方式時(shí),具體參數(shù)配置說明,請(qǐng)參見OSS + API 數(shù)據(jù)源。
API:全量與實(shí)時(shí)數(shù)據(jù)均通過API寫入。
進(jìn)行字段配置,參數(shù)配置完成后,單擊下一步。
將以下字段配置文件示例內(nèi)容保存為JSON文件,然后單擊右上角的導(dǎo)入字段索引結(jié)構(gòu),并按控制臺(tái)操作指引導(dǎo)入索引文件。導(dǎo)入后,將基于文件內(nèi)容填寫字段配置和索引結(jié)構(gòu)。
{ "schema": { "summarys": { "parameter": { "file_compressor": "zstd" }, "summary_fields": [ "id", "embedding", "file_path", "file_name", "file_type", "node_content", "node_type", "doc_id", "text", "source_type" ] }, "file_compress": [ { "name": "file_compressor", "type": "zstd" }, { "name": "no_compressor", "type": "" } ], "indexs": [ { "index_fields": [ { "boost": 1, "field_name": "id" }, { "boost": 1, "field_name": "embedding" } ], "indexer": "aitheta2_indexer", "index_name": "embedding", "parameters": { "enable_rt_build": "true", "min_scan_doc_cnt": "20000", "vector_index_type": "Qc", "major_order": "col", "builder_name": "QcBuilder", "distance_type": "SquaredEuclidean", "embedding_delimiter": ",", "enable_recall_report": "true", "ignore_invalid_doc": "true", "is_embedding_saved": "false", "linear_build_threshold": "5000", "dimension": "1536", "rt_index_params": "{\"proxima.oswg.streamer.segment_size\":2048}", "search_index_params": "{\"proxima.qc.searcher.scan_ratio\":0.01}", "searcher_name": "QcSearcher", "build_index_params": "{\"proxima.qc.builder.quantizer_class\":\"Int8QuantizerConverter\",\"proxima.qc.builder.quantize_by_centroid\":true,\"proxima.qc.builder.optimizer_class\":\"BruteForceBuilder\",\"proxima.qc.builder.thread_count\":10,\"proxima.qc.builder.optimizer_params\":{\"proxima.linear.builder.column_major_order\":true},\"proxima.qc.builder.store_original_features\":false,\"proxima.qc.builder.train_sample_count\":3000000,\"proxima.qc.builder.train_sample_ratio\":0.5}" }, "index_type": "CUSTOMIZED" }, { "has_primary_key_attribute": true, "index_fields": "id", "is_primary_key_sorted": false, "index_name": "id", "index_type": "PRIMARYKEY64" }, { "index_fields": "file_path", "index_name": "file_path", "index_type": "STRING" }, { "index_fields": "file_name", "index_name": "file_name", "index_type": "STRING" }, { "index_fields": "file_type", "index_name": "file_type", "index_type": "STRING" }, { "index_fields": "node_content", "index_name": "node_content", "index_type": "STRING" }, { "index_fields": "node_type", "index_name": "node_type", "index_type": "STRING" }, { "index_fields": "doc_id", "index_name": "doc_id", "index_type": "STRING" }, { "index_fields": "text", "index_name": "text", "index_type": "STRING" }, { "index_fields": "source_type", "index_name": "source_type", "index_type": "STRING" } ], "attributes": [ { "file_compress": "no_compressor", "field_name": "id" }, { "file_compress": "no_compressor", "field_name": "embedding" }, { "file_compress": "no_compressor", "field_name": "file_path" }, { "file_compress": "no_compressor", "field_name": "file_name" }, { "file_compress": "no_compressor", "field_name": "file_type" }, { "file_compress": "no_compressor", "field_name": "node_content" }, { "file_compress": "no_compressor", "field_name": "node_type" }, { "file_compress": "no_compressor", "field_name": "doc_id" }, { "file_compress": "no_compressor", "field_name": "text" }, { "file_compress": "no_compressor", "field_name": "source_type" } ], "fields": [ { "compress_type": "uniq", "field_type": "STRING", "field_name": "id" }, { "user_defined_param": { "multi_value_sep": "," }, "multi_value": true, "compress_type": "uniq", "field_type": "FLOAT", "field_name": "embedding" }, { "compress_type": "uniq", "field_type": "STRING", "field_name": "file_path" }, { "compress_type": "uniq", "field_type": "STRING", "field_name": "file_name" }, { "compress_type": "uniq", "field_type": "STRING", "field_name": "file_type" }, { "compress_type": "uniq", "field_type": "STRING", "field_name": "node_content" }, { "compress_type": "uniq", "field_type": "STRING", "field_name": "node_type" }, { "compress_type": "uniq", "field_type": "STRING", "field_name": "doc_id" }, { "compress_type": "uniq", "field_type": "STRING", "field_name": "text" }, { "compress_type": "uniq", "field_type": "STRING", "field_name": "source_type" } ], "table_name": "abc" }, "extend": { "description": [], "vector": [ "embedding" ], "embeding": [] } }
進(jìn)行索引結(jié)構(gòu)配置,參數(shù)配置完成后,單擊下一步。
其中關(guān)鍵配置說明如下,其他參數(shù)配置說明,請(qǐng)參見向量索引通用配置。
向量維度:設(shè)置為512。
距離類型:建議選擇InnerProduct。
在確認(rèn)創(chuàng)建配置向?qū)ы撁妫瑔螕?b data-tag="uicontrol" id="720476a2f4kqv" class="uicontrol">確認(rèn)創(chuàng)建。
系統(tǒng)將自動(dòng)跳轉(zhuǎn)至表管理頁面,當(dāng)狀態(tài)為使用中時(shí),表明索引表創(chuàng)建成功。
3.為OpenSearch向量檢索版實(shí)例開通公網(wǎng)訪問功能
目前,EAS只能通過公網(wǎng)訪問OpenSearch,需要具備訪問公網(wǎng)的能力。因此,您需要為EAS添加VPC,并為該VPC綁定NAT網(wǎng)關(guān)和彈性公網(wǎng)IP(EIP)。同時(shí),為確保OpenSearch實(shí)例能夠接收來自EAS實(shí)例的公網(wǎng)請(qǐng)求,您需要為OpenSearch開通公網(wǎng)訪問,并將上述EIP地址加入白名單。以下內(nèi)容為您介紹如何為EAS的VPC配置公網(wǎng)訪問OpenSearch功能,EAS可以使用與OpenSearch相同的VPC,也可以使用其他VPC。
為后續(xù)部署RAG服務(wù)時(shí)綁定的專有網(wǎng)絡(luò)(VPC)配置公網(wǎng)訪問功能。具體操作,請(qǐng)參見使用公網(wǎng)NAT網(wǎng)關(guān)SNAT功能訪問互聯(lián)網(wǎng)。
查看已綁定的彈性公網(wǎng)IP地址。
登錄專有網(wǎng)絡(luò)管理控制臺(tái)。單擊專有網(wǎng)絡(luò)實(shí)例ID,并切換到資源管理頁簽。
單擊已綁定的公網(wǎng)NAT網(wǎng)關(guān),進(jìn)入公網(wǎng)NAT網(wǎng)關(guān)頁面。
單擊公網(wǎng)NAT網(wǎng)關(guān)實(shí)例ID,進(jìn)入基本信息頁面。
單擊綁定的彈性公網(wǎng)IP,查看已綁定的彈性公網(wǎng)IP地址,并保存到本地。
在OpenSearch向量檢索版實(shí)例列表頁面,單擊目標(biāo)實(shí)例名稱,進(jìn)入實(shí)例詳情頁面。
在網(wǎng)絡(luò)信息區(qū)域,打開公網(wǎng)訪問開關(guān),并在修改公網(wǎng)訪問白名單配置面板中,按照控制臺(tái)操作指引,將上述步驟已查詢的彈性公網(wǎng)IP配置為公網(wǎng)訪問白名單。
在網(wǎng)絡(luò)信息區(qū)域,將公網(wǎng)域名后的訪問地址保存到本地。
4.查看實(shí)例用戶名和密碼
即在創(chuàng)建OpenSearch向量檢索版實(shí)例時(shí),輸入的用戶名和密碼。您可以在實(shí)例詳情頁面的API入口區(qū)域查看。
部署RAG服務(wù)并關(guān)聯(lián)OpenSearch
登錄PAI控制臺(tái),在頁面上方選擇目標(biāo)地域,并在右側(cè)選擇目標(biāo)工作空間,然后單擊進(jìn)入EAS。
在模型在線服務(wù)(EAS)頁面,單擊部署服務(wù),然后在場(chǎng)景化模型部署區(qū)域,單擊大模型RAG對(duì)話系統(tǒng)部署。
在部署大模型RAG對(duì)話系統(tǒng)頁面,配置以下關(guān)鍵參數(shù),其他參數(shù)配置說明,請(qǐng)參見步驟一:部署RAG服務(wù)。
參數(shù)
描述
基本信息
模型來源
選擇開源公共模型。
模型類別
選擇模型類別,本方案以大模型Qwen1.5-1.8b為例。
資源配置
資源配置選擇
系統(tǒng)會(huì)根據(jù)已選擇的模型類別,自動(dòng)推薦適合的資源規(guī)格。更換至其他資源規(guī)格,可能會(huì)導(dǎo)致模型服務(wù)啟動(dòng)失敗。
向量檢索庫設(shè)置
版本類型
選擇OpenSearch。
訪問地址
配置為步驟二中已獲取的公網(wǎng)域名,不帶http://或https://,例如ha-cn-****.public.ha.aliyuncs.com。
實(shí)例id
配置為步驟二中已獲取的OpenSearch向量檢索版實(shí)例的ID。
用戶名
配置為創(chuàng)建OpenSearch向量檢索版實(shí)例時(shí)設(shè)置的用戶名。
密碼
配置為創(chuàng)建OpenSearch向量檢索版實(shí)例時(shí)設(shè)置的密碼。
表名稱
配置為步驟二中已創(chuàng)建的索引表名稱。
專有網(wǎng)絡(luò)配置
VPC
您可以選擇與OpenSearch一致的專有網(wǎng)絡(luò)和交換機(jī)。
您也可以使用其他專有網(wǎng)絡(luò),但需要確保該專有網(wǎng)絡(luò)具有公網(wǎng)訪問能力,并將綁定的彈性公網(wǎng)IP添加為OpenSearch實(shí)例的公網(wǎng)訪問白名單。具體操作,請(qǐng)參見使用公網(wǎng)NAT網(wǎng)關(guān)SNAT功能訪問互聯(lián)網(wǎng)和公網(wǎng)白名單配置。
交換機(jī)
安全組
選擇安全組。
參數(shù)配置完成后,單擊部署。
使用RAG對(duì)話系統(tǒng)
RAG對(duì)話系統(tǒng)的基本使用方法如下,更多詳細(xì)介紹,請(qǐng)參見大模型RAG對(duì)話系統(tǒng)。
1、配置RAG對(duì)話系統(tǒng)
RAG服務(wù)部署成功后,單擊服務(wù)方式列下的查看Web應(yīng)用,啟動(dòng)WebUI頁面。
測(cè)試向量檢索庫OpenSearch連接是否正常。
系統(tǒng)已自動(dòng)識(shí)別并應(yīng)用了部署服務(wù)時(shí)配置的向量檢索庫設(shè)置,您可以單擊Connect OpenSearch,來驗(yàn)證OpenSearch向量檢索版實(shí)例是否連接正常。如果連接失敗,請(qǐng)參考步驟二:準(zhǔn)備配置項(xiàng),檢查向量檢索庫配置是否正確,修改對(duì)應(yīng)配置項(xiàng)為正確配置,然后單擊Connect OpenSearch,重新連接OpenSearch實(shí)例。
2、上傳企業(yè)知識(shí)庫文件
您可以按照以下流程上傳您的企業(yè)知識(shí)庫文件,系統(tǒng)會(huì)自動(dòng)按照PAI-RAG格式將知識(shí)庫存儲(chǔ)到向量檢索庫中,以方便您進(jìn)行后續(xù)的知識(shí)檢索。您也可以利用向量檢索庫中已有的知識(shí)庫,但必須符合PAI-RAG格式要求,否則可能會(huì)導(dǎo)致檢索報(bào)錯(cuò)。
在Upload頁簽,設(shè)置語義分塊參數(shù)。
通過配置以下參數(shù)來控制文檔分塊粒度的大小和進(jìn)行QA信息提取:
參數(shù)
描述
Chunk Size
指定每個(gè)文本分塊的大小,單位為字節(jié),默認(rèn)為500。
Chunk Overlap
表示相鄰分塊之間的重疊量,默認(rèn)為10。
Process with QA Extraction Model
通過選中Yes復(fù)選框啟動(dòng)QA信息提取功能,系統(tǒng)將在您上傳企業(yè)知識(shí)庫文件后自動(dòng)抽取出QA對(duì),以獲得更好的檢索和回答效果。
在Files或Directory頁簽下上傳企業(yè)知識(shí)庫文件(支持多文件上傳)或?qū)?yīng)目錄。支持的文件類型為.txt、.pdf、Excel(.xlsx或.xls)、.csv、Word(.docx或.doc)、Markdown或.html,例如rag_chatbot_test_doc.txt。
單擊Upload,系統(tǒng)會(huì)先對(duì)上傳的文件進(jìn)行數(shù)據(jù)清洗(包括文本提取、超鏈接替換等)和語義切塊,然后進(jìn)行上傳。
3、進(jìn)行知識(shí)問答
將檢索返回的結(jié)果與用戶的問題輸入至已選擇的Prompt模板中,送入EAS-LLM服務(wù),從中獲取問答結(jié)果。
OpenSearch特色功能支持
阿里云OpenSearch向量檢索版為客戶提供了便捷的圖形化界面,可以高效管理索引表(Table)以及索引(Index),以下內(nèi)容將為您介紹,如何使用OpenSearch向量檢索版控制臺(tái),查看索引信息并實(shí)現(xiàn)簡單的數(shù)據(jù)管理。
索引表管理
進(jìn)入阿里云OpenSearch向量檢索版實(shí)例詳情頁面。
單擊已創(chuàng)建的實(shí)例ID,進(jìn)入實(shí)例詳情頁面。
進(jìn)入表管理頁面,對(duì)索引表進(jìn)行管理操作。
在左側(cè)導(dǎo)航欄,單擊表管理。
頁面中展示當(dāng)前實(shí)例下創(chuàng)建的所有表。
在表管理頁面,對(duì)索引表進(jìn)行管理操作,包括查看字段及索引結(jié)構(gòu)、編輯索引、索引重建以及刪除索引等。具體操作細(xì)節(jié),請(qǐng)參見表管理。
數(shù)據(jù)管理
進(jìn)入阿里云OpenSearch向量檢索版實(shí)例詳情頁面。
單擊已創(chuàng)建的實(shí)例ID,進(jìn)入實(shí)例詳情頁面。
添加數(shù)據(jù)。
在左側(cè)導(dǎo)航欄,單擊
。在頁面右側(cè)下拉列表中,選擇表單模式或開發(fā)者模式。
選擇要添加數(shù)據(jù)的目標(biāo)索引表(Table)名稱。
按字段輸入數(shù)據(jù)內(nèi)容或填寫數(shù)據(jù)寫入語句,然后單擊添加。具體操作請(qǐng)參見:添加數(shù)據(jù)。
當(dāng)執(zhí)行結(jié)果出現(xiàn)
"message": "success"
時(shí),表示數(shù)據(jù)上傳成功,即可完成單條數(shù)據(jù)或多條數(shù)據(jù)的添加。
查看表指標(biāo)數(shù)據(jù)。
在左側(cè)導(dǎo)航欄,單擊
。選擇要查看數(shù)據(jù)的目標(biāo)索引表(Table)名稱,即可查看索引內(nèi)文檔個(gè)數(shù)、每秒請(qǐng)求成功次數(shù)等指標(biāo)。詳情請(qǐng)參見表指標(biāo)。
刪除數(shù)據(jù)。
在左側(cè)導(dǎo)航欄,選擇
。在頁面右側(cè)下拉列表中,選擇表單模式或開發(fā)者模式。
選擇表名并輸入主鍵,然后單擊刪除。具體操作請(qǐng)參見:刪除數(shù)據(jù)。
當(dāng)執(zhí)行結(jié)果出現(xiàn)
"message": "success"
時(shí),表示數(shù)據(jù)刪除成功。
相關(guān)文檔
針對(duì)AIGC和LLM的典型前沿場(chǎng)景,EAS提供了簡化的部署方式。您可以很方便地一鍵拉起服務(wù),包括ComfyUI部署、Stable Diffusion WebUI部署、ModelScope模型部署、HuggingFace模型部署、Triton部署以及TFserving部署等。詳情請(qǐng)參見EAS場(chǎng)景化部署說明。
RAG服務(wù)WebUI界面提供了豐富的推理參數(shù)配置選項(xiàng),以滿足多樣化需求。此外,RAG服務(wù)也支持通過API接口進(jìn)行調(diào)用。具體實(shí)現(xiàn)細(xì)節(jié)以及參數(shù)配置說明,請(qǐng)參見大模型RAG對(duì)話系統(tǒng)。
大模型RAG對(duì)話系統(tǒng)還支持與其他向量檢索庫進(jìn)行關(guān)聯(lián),例如Milvus、Elasticsearch或RDS PostgreSQL等。詳情請(qǐng)參見基于EAS&Milvus搭建RAG檢索增強(qiáng)對(duì)話系統(tǒng)、基于EAS&Elasticsearch搭建RAG檢索增強(qiáng)對(duì)話系統(tǒng)或基于EAS&RDS PostgreSQL搭建RAG檢索增強(qiáng)對(duì)話系統(tǒng)。