NLP自學習平臺常見問題。
1、NLP自學習平臺服務調用限制
算法類型 | 單模型QPS | 最大請求長度(字節) |
文本實體抽取 | 20 | 暫無限制 |
文本分類 | 20 | 暫無限制 |
關鍵短語抽取 | 20 | 暫無限制 |
短文本匹配 | 20 | 暫無限制 |
關系抽取 | 20 | 暫無限制 |
簡歷抽取 | 20 | 暫無限制 |
商品評價解析 | 20 | 暫無限制 |
情感分析 | 20 | 暫無限制 |
2、長度限制
問:文本實體抽取預測時文本有沒有長度限制?
答:目前沒有限制,但是過長的文本會導致超時。建議控制在1000字以內,超長的文本可以根據“\n”或“。”(換行符或句號)對文本進行切分?;蚴褂梦覀兊漠惒筋A測接口,該接口支持10000字的預測,使用文檔:異步預測接口使用示例
問:文本實體抽取預測時對長文本進行切分是否會影響模型預測效果?
答:根據“\n”或“。”(換行符或句號)對文本進行切分,并不會影響模型預測的準確率。鼓勵將過長的樣本進行切分處理后預測。
3、子賬號授權相關問題
3.1 子賬號授權操作步驟
1、在RAM訪問控制的權限管理中新建權限策略(https://ram.console.aliyun.com/policies)
2、輸入策略腳本配置
NLP自學習平臺腳本策略
{
"Statement": [
{
"Effect": "Allow",
"Action": "nlp-automl:*",
"Resource": "*"
}
],
"Version": "1"
}
3、在人員管理用戶tab中,對想要授權的子賬號進行添加權限操作
4、選擇剛剛創建的自定義權限策略,即可完成授權
3.2 子賬號有哪些權限
目前被授權的子賬號將擁有幾乎全部的平臺管理權限(除售賣相關的操作和查看權限):
平臺資源 | 權限 | 授權子賬號是否有對應權限 |
項目 | all | 是 |
模型 | all | 是 |
數據 | all | 是 |
監控統計 | all | 是 |
售賣相關 | all | 否 |
3.3 其他注意事項
目前只有主賬號有售賣相關的操作和查看權限。
授權的子賬號登錄后直接跳轉到控制臺”我的項目”鏈接,未授權的子賬號跳轉到標注中心。
一個標注項目的管理員是:這個標注項目所在項目A的創建人或項目A的授權賬號。
主賬號擁有標注任務的編輯權限,可以為標注任務增加參加標注的子賬號。
標注項目的質檢人員是該標注項目的管理員。
所有項目和模型的創建用戶ID默認是主賬號ID。
predict接口(內部和外部)的發起調用時,調用者ID默認是主賬號。
predict接口推送的sls日志的數據中包含著調用者實際為主賬號或子賬號的信息。
售賣按主賬號計算。
若近一周日均調用量超過50萬的,可與我們聯系提高QPS,歡迎聯系銷售經理洽談。
4、實體抽取項目常見問題
4.1 標注注意事項
實體抽取項目中,需要對待標注文檔中所有出現的實體予以標注。(建議打開左上角的“同值標注” 功能 )
某文檔中對某個實體已經有過標注了,在另一篇文檔中還需要對相同實體進行標注嗎?
答:需要
被標注的實體中不能出現換行符“\n”或句號“?!?/b>,否則將不能識別,但不會影響訓練。
4.2 更高級的規則引擎設置
問:做實體抽取任務時,我的文檔格式比較固定,需要抽取的字段有明確和固定的上下文,有沒有不需要大量標注,又好又快的抽取方案?
答: 有!為了提升實體抽取模型的表現和效率,我們還開放了規則引擎模塊供用戶選擇(如有需要,請聯系我們加入白名單,釘釘群號:44619071)。在創建模型時可以配置。規則引擎的界面如下:
您可以通過規則配置來配置正則、詞典、任意字符和模型抽出的實體的組合等“規則”,并且通過規則預覽可以測試下您的規則是否生效。
規則配置示例:
我有如下裁判文書,需要抽取原告和被告的姓名、性別、出生年月:
原告:橙小二,女,住所地浙江省杭州市余杭區。\n\n被告:王某某,男,2019年10月1日出生,漢族。
就可以使用規則引擎來配置正則表達式,抽取出這些字段:
新增規則組->實體類型選原告->規則要素選擇正則表達式->值填入 (?<=原告:)([^,]+)(?=,)
配置好幾個規則后,點擊規則預覽,則可以檢查剛剛配置的規則:
4.3 實體抽取項目常見的抽取字段
平臺提供常見字段的抽取能力,例如日期、手機號碼等,勾選后,您創建的模型將可同時抽取勾選字段。(由于創建模型需要標注數據,若想直接使用該功能,您可以隨意標注10條數據訓練一個模型,注意需在高級設置中勾選您想使用的通用字段)
入口(實體抽取項目->模型中心->創建模型->進入高級設置):
5、購買及續費常見問題
5.1 續費時提示模型數量超變更規格數量
在續費頁面中,如提示模型數量已超變更規格數量,請先在 我的模型頁 查看模型總量與模型使用量情況,確保已使用量小于等于總量。
若模型使用量大于模型總量(例如:試用時使用了3個模型且未刪除,正式付費購買時,僅購買了1個),您可以:
直接刪除不準備使用的模型(注意:模型刪除后將無法恢復)
點擊增加個數,通過 變配 的方式,提升模型總量額度
5.2自學習平臺訓練模型下數據標注任務個數有限制嗎?
答:單個模型下的數據標注任務沒有限制。
5.3可以直接購買資源包嗎?
答:資源包是用于模型調用的,如果你需要模型訓練,還需要購買模型包月。
5.4自學習平臺套餐用完了會自動扣費,是否可以關閉?
自學習平臺是按量計費型產品,開通自學習平臺就開通了按次調用后付費。
資源包提供了更優惠的按次調用計費價格,在計費時進行抵扣,超過資源包的部分仍然是按照后付費計費。
目前暫不支持單獨關閉后付費,如需關閉后付費,就需要關閉自學習平臺產品。
計費標準可參考【產品價格】文檔
6、一般常見問題
6.1 阿里云的AccessKeyId和AccessKeySecret是否通用?
阿里云各個服務的AccessKeyId和AccessKeySecret是通用的,使用前需先開通對應的服務。
6.2 多個數據集需要購買多個模型嗎?
答:數據集數量和模型無關,只有需要同時訓練多個模型才需要購買多個模型。
6.3 如何提高QPS
若近一周日均調用量超過50萬的,可與我們聯系提高QPS,加入“阿里云NLP自學習平臺用戶答疑二群”(釘釘群號:44619071)咨詢。