視頻理解是基于阿里云深度學習技術,對視頻內容進行視頻鏡頭分析,抓取視頻中的精彩片段或單張畫面作為視頻封面,提升視頻的點擊率和用戶體驗。
服務開通
能力介紹
目前阿里云視覺智能開放平臺上線的視頻理解能力包括:
類別 | 能力 | 說明 |
視頻理解 | 輸入一段視頻通過算法解析視頻,把具有吸引力的內容進行輸出,可輸出多個視頻封面。 | |
對輸入的視頻按鏡頭切分,返回切分點。 | ||
可以分析出視頻中的明星、素人、游戲畫面等各種元素。 | ||
可以識別視頻中的文本,可涵蓋新聞、影視劇、娛樂、體育等多場景的中英文、繁簡體、比分等識別,支持普通字幕、定常字幕、滾動字幕、部分自然場景文字、豎排文字及藝術字等多種類型。 | ||
可以多維度對視頻進行分析理解,將視頻拆解為多個片段并返回每個片段的邊界時間點(不返回具體視頻片段),并對片段進行摘要描述,拆分維度包含鏡頭和主題等。 | ||
可以評估輸入視頻的質量,包含基礎質量評估和瑕疵質量評估兩種模式,并輸出質量評估綜合報告和詳細報告。 |
應用場景
視頻理解的應用場景如下:
精彩視頻推薦
使用智能視頻封面選圖服務,快速為長/短視頻選出最具代表性的高質封面,提升用戶的視覺體驗,便于快速篩選視頻,提升用戶留存。
視頻精彩封面圖
為視頻內容生成最精彩的封面,把最具吸引力的內容呈現出來,有效幫助提升視頻內容的點擊率,提高用戶停留時長。
更多產品動態,請您持續關注阿里云視覺智能開放平臺。
文檔內容是否對您有幫助?