本文將向您介紹智能媒體管理IMM產品中涉及的幾個基本概念,以便于您更好地理解IMM產品。
元數據
智能媒體管理提供的元數據管理功能可以幫助用戶對存儲在對象存儲(OSS)、相冊與網盤服務(PDS)等產品中的文件的元數據進行采集、分析、查詢等。
元數據管理支持的文件元數據包括:
文件大小、文件格式、創建時間等文件的基礎信息。
文檔類文件的全文和壓縮包內的所有文件信息。
利用智能媒體管理服務的人工智能(AI)引擎對圖片、視頻、音頻等媒體文件進行分析得到的標簽、人物、文本等豐富的元數據信息。
項目
開發者使用智能媒體管理服務的基本單元。開發者通過創建項目來使用IMM的功能,為數據集配置限額。
數據集
數據集是由元數據所組成的集合,是智能媒體管理存放元數據的容器。例如開發者開發網盤APP時,文件存儲在OSS或PDS中,在IMM中創建數據集,將用戶上傳的文件OSS或PDS地址提交給IMM進行索引,IMM會自動解析文件的基礎信息,對圖片、視頻、音頻等媒體文件進行人工智能分析,提取標簽、人物等信息。
工作流
在創建IMM項目或數據集時,可以為項目或數據集設置工作流模板(Template),模板定義了提取文件元信息時所需要執行的工作流。
IMM提供的工作流模板如下:
Official:DefaultEmptyId:在建立元數據索引時,所有算子都不操作,不會產生元數據信息。
Official:OSSBasicMeta:在建立元數據索引時,執行OSSMeta算子,采集OSS基本元數據。
Official:AllFunction:在建立元數據索引時,執行所有算子,采集OSS基本元數據、MIME信息、人臉信息、標簽檢測、圖片打分、地址位置信息、視頻信息、圖片EXIF信息等數據。
算子
工作流執行的基本單元。IMM處理引擎將根據配置的工作流模板來決定要執行的算子操作,算子對元數據進行采集并將元數據索引到數據集中。
請求類型
同步請求
客戶端發出請求后阻塞等待結果返回,通常在幾百毫秒內返回。例如圖片實例中的人臉檢測、內容識別等。
異步請求
為了解決同步任務執行時間太長,導致客戶端阻塞太久的問題,例如超過10秒客戶端可能會連接斷開,因此智能媒體管理引入了異步請求機制。
客戶端發出請求后,系統會快速返回ID,基于此ID,可以查詢異步請求的狀態。例如大文件的格式轉換請求可能幾十秒,甚至分鐘級才能完成。
任務
單個數據處理異步請求的執行實體,調用異步請求API返回的ID,即任務ID。例如執行單個文檔的異步轉換,它的執行實體就是一個任務。
任務創建后,支持查詢任務狀態,刪除任務,遍歷任務請求。