視頻OCR模板可以在視頻中框選出含文字部分時,自動對框內文字進行識別。
數據格式示例
CSV及XLSX格式中每一列數據;Manifest格式中data字段的下一級字段均對應一個數據集字段,字段名可自定義,在配置數據集字段名時選擇對應的字段名即可。
CSV及XLSX格式
video_url |
oss://****.oss-cn-hangzhou.aliyuncs.com/iTAG/mov/1.mp4 |
oss://****.oss-cn-hangzhou.aliyuncs.com/iTAG/mov/2.mp4 |
文件Demo參考:視頻數據demo.csv
Manifest格式(JSONL格式)
{"data":{"video_url":"oss://****.oss-cn-hangzhou.aliyuncs.com/iTAG/mov/1.mp4"}}
{"data":{"video_url":"oss://****.oss-cn-hangzhou.aliyuncs.com/iTAG/mov/10.mp4"}}
文件Demo參考:視頻數據demo.manifest
使用限制
模板支持的視頻格式:MP4、WebM、OGG。
視頻長度:建議在5分鐘。
配置說明
標注區(必選)
待標注視頻用于配置視頻字段。
單擊選中待標注視頻,并選擇相應的數據集后,在右側配置區域配置具體參數。參數說明如下:
參數 | 說明 |
標題 | 默認標題區域無需修改。 |
數據集字段 | 在數據集字段中選擇視頻URL字段。(字段名稱可自定義) |
提示 | 默認提示區域無需修改。 |
卡片樣式配置 | 無需配置,不生效。 |
全局配置
全局配置用于配置模板中會使用到的UDF(User Defined Function),此處可以選擇配置獲取視頻fps的UDF。
單擊,在右側可以進行問答機器人的配置。參數說明如下:
參數 | 說明 |
標題 | 默認標題區域無需修改。 |
組件版本 | 無需配置,不生效。 |
預標注 | 在此處配置獲取視頻fps的UDF,需要嚴格按照圖示進行配置。 |
數據校驗 | 無需配置,不生效。 |
其他
單擊返回,即可返回到模板選擇頁面。
單擊智能化配置,可配置預標注、UDF等服務。
單擊廢棄配置,可設置是否允許廢棄樣本。
單擊導入數據集,可以更改需要導入的數據集。
單擊導出模板,可以導出并復制JSON格式的模板。
單擊保存模板,可以保存當前配置完成的模板。
單擊創建任務,可以保存當前配置完成的模板并創建相應任務。
操作演示
在視頻中框選出含文字的部分后,雙擊框會出現彈窗,彈窗內的內容為OCR自動識別出的文字內容。新建ID并保存后,數據會同步展示在視頻、右側答題區及下側時間軸區域中。
找到該ID內容出現的幾個關鍵幀,進行框選并選擇相同ID進行保存后,三個區域內的數據展示會同步進行更新。
雙擊視頻中的框,可對該ID對應的內容進行編輯/刪除操作。懸停于右側答題區數據操作列的,可查看該ID內容的幾個關鍵幀,單擊可跳轉到對應的關鍵幀處。單擊數據操作列的,可刪除該ID對應數據。
懸停于時間軸處的數據條上,可以查看該數據的全文本內容。雙擊數據條,可跳轉到該數據起始幀處。