本文用于介紹表格問答表格數據導入與管理功能使用方法。
概述
數據問答能力是系統算法運用“給定表格”的基礎上形成的,數據表管理則是用于“給定表格”。在表格數據管理中,集合了有關表格數據的新增、編輯、刪除與更新等功能,以方便高效地管理相關表格數據。
功能入口
進入有關機器人空間后,選擇表格管理>數據表管理后,選擇常規數據表,即可進入表格數據管理界面。具體如下圖所示:
常規數據表
添加數據表
產品功能上,支持新增單個表格最大100列,1萬行,大小為50M。批量表格上傳最大數量為20個,大小為400M。
購買智能對話機器人(通義版)的版本不同,具有的配額資源不同,如企業版(通義版)導入表格數量上限為50個,具體有關版本資源的詳情可參考《產品計費》。
綁定已有數據表
綁定已有數據表是指將業務空間下的表格數據綁定在機器人上。
單擊綁定已有數據按鈕;
在彈窗中選中需綁定的表格,單擊確定按鈕完成表格綁定。具體操作如下圖所示:
新建數據表
本地Excel表格文件上傳
進入常規數據表頁面后,點擊新建數據表按鈕;
在新建數據表窗口選擇數據來源為Excel表格;
根據實際業務需求,填寫數據表名稱并點擊上傳本地文件導入Excel表格文件;
從MySQL數據庫導入
進入常規數據表頁面后,點擊新建數據表按鈕;
在新建數據表窗口選擇數據來源為數據庫>MySQL;
根據實際業務需求,填寫數據表名稱、更新時間列信息,選擇數據源和物理表等:
數據源:即在表格管理>數據源管理中創建的數據源,當前數據源類型僅支持為MySQL數據庫。
物理表:即數據庫下的具體表格。
更新時間列:即數據庫的物理表中關于數據更新時間的列。
“更新時間列”用于系統實時檢測有關數據是否有更新,若對查詢的數據實時性要求較高,建議表中含有最后更新時間列,并在“選擇更新時間列”下拉框中選中該列名稱,方便系統及時讀取最新數據。
當物理表中有“更新時間列”,若數據庫中更新時間列中的數據有更新,系統自動同步更新元數據。
編輯數據表
當前僅支持對有關表格中表頭字段的編輯配置,不支持在控制臺中直接編輯表格中具體單元格中的數值。
從本地上傳的表格和從編輯從數據庫導入的表格編輯界面略有差異,但表頭字段的編輯操作一致,此處以從編輯本地上傳的表格為例進行介紹。
完成表格新增后,點擊編輯按鈕后,選擇字段配置標簽即可進入有關表頭編輯界面;
根據實際業務需求,編輯有關表頭字段:
編輯字段:包括表頭字段的英文名、中文名、字段類型/輸出格式、字段描述、近似查詢、誤差范圍。
字段英文名:若數據源為數據庫,即數據庫中的字段名稱;若數據源為表格文件,系統根據表格中字段中文名稱自動翻譯的英文名稱。
字段中文名:是對字段所表示的含義進行解釋,將直接影響召回信息,對問答效果有影響,建議根據字段含義認真填寫。
字段類型/輸出格式:字段在機器人回復答案中的輸出格式。當前支持的字段類型有:
數字范圍型格式:第一個數字必須小于第二個數字,必須為數字或者小數,不支持千分位數字;示例[10000, 20000]。
數字數組型格式:必須為數字或者小數,不支持千分位數字;示例[3000, 10000, 20000]。
日期范圍型格式:第一個日期必須小于第二個日期,日期格式為"yyyy-MM-dd HH:mm:ss"、"yyyy-MM-dd"、"yyyy/MM/dd"、"yyyy年MM月dd日",對同一個字段,兩種格式不能同時存在;示例:["2023-11-01 00:00:00", "2023-11-11 00:00:00"]。
日期數組型格式:日期格式為"yyyy-MM-dd HH:mm:ss"、"yyyy-MM-dd"、"yyyy/MM/dd"、"yyyy年MM月dd日",對同一個字段,兩種格式不能同時存在;示例["2023-11-01", "2023-11-11", "2023-10-22"]。
文本數組型格式:所有元素必須為文本,并使用雙引號括起來;示例["性能卓越", "穩定可靠", "即開即用","彈性擴展"]。
字段描述:是對表頭字段所表示的含義、用途注意事項等內容進行解釋,該項對問答有影響,建議認真填寫。
關聯字段:支持通過外鍵關聯其他表,即一個問題通過多個數據表來查詢,數據可存儲在不同的數據表中,通過字段的關聯關系實現跨數據表的查詢,例如:查詢學生A的學號(基本信息表)和保險號(保險表)。
全文索引:啟用索引后,用戶輸入的問題會與字段內容對比,查詢出相關的內容。
刪除表頭:即刪除有關列;
表頭表值干預:對指定表頭的識別能力的干預,針對所選表頭生效。包括:表頭同義詞、表值同義詞和環境參數,有關具體介紹可參考《數據問答干預》。
更新表格
更新從本地上傳的數據表
進入有關表格更新界面后,點擊更新數據按鈕后,上傳待更新表格即可。
上傳更新數據表格時,系統會校驗當前上傳表格的第一個sheet名稱和產品頁面上的數據表名稱是否一致,如不同則無法上傳。
更新從數據庫導入的數據表
字段同步
當數據庫中新增或刪除有關列的字段后,通過同步字段功能,系統會自動檢測數據庫中的字段變更內容,并可根據實際業務需求選擇是否對有關元數據做字段變更同步。具體操作如下:
選擇表格管理>數據表管理后,單擊編輯按鈕,進入有關表格編輯界面;
單擊同步字段按鈕后,根據實際業務需求確認同步字段的變更。
增量數據更新
當綁定的數據庫中的有關數據表有變化更新時,通過配置“更新時間列”,系統快速自動同步更新有關數據。具體配置步驟如下:
數據庫中有關物理表配置“更新時間列”,當有關行數據變更時,在此列中進行變更時間記錄;
說明此步驟需要用戶在自己的數據庫中的物理表中進行配置操作。
進入有關表格編輯界面,綁定有關更新時間列。
全量數據更新
全量數據更新是指全量讀取配置的數據庫表,可通過全量同步功能完成。具體操作如下:選擇表格管理>數據表管理后,單擊有關數據表右側全量同步按鈕并確定即可。
全量同步適用于數據庫內容進行了大量更新的場景,所需時間較長,對資源消耗也較大,建議必要時才使用。
表格生效狀態管理
失效:表示數據表不參與問答,有關失效狀態如下圖所示:
生效:表示數據表可以參與問答,有關生效狀態如下圖所示: