功能特性
媒體處理可以將一個音視頻文件轉(zhuǎn)換成另一個或多個音視頻文件,以適應不同網(wǎng)絡帶寬、終端設備和用戶的需求。對媒體的內(nèi)容、文字、語音、場景進行多模態(tài)分析,實現(xiàn)智能審核、內(nèi)容理解、智能編輯等多種處理功能。
音視頻轉(zhuǎn)碼
把音視頻碼流轉(zhuǎn)換為另一種清晰度、編碼格式或封裝格式,以適應不同網(wǎng)絡帶寬、不同終端播放設備的使用場景。媒體處理覆蓋了主流編碼及封裝格式,并且支持在轉(zhuǎn)碼過程中添加水印、字幕、簡單剪輯等處理,詳見下文。未在控制臺或API展示的功能,請通過商務人員聯(lián)系技術(shù)團隊。
以下功能需要提交轉(zhuǎn)碼作業(yè)使用,按照輸出的視頻規(guī)格和時長,收取普通轉(zhuǎn)碼費用。計費說明請參見轉(zhuǎn)碼定價。
參數(shù) | 類型 | 說明 |
輸入文件 | 封裝格式 |
|
視頻編碼格式 | Apple ProRes、AVS+、AVS、AVS2、H.263、 H.263+、H.264/AVC、H.265/HEVC、H.266/VVC、MJPEG、MPEG-1、MPEG-2、MPEG-4、Quicktime、RealVideo、VP8、VP9、Windows Media Video。 | |
音頻編碼格式 | AAC、AC3、ADPCM、AMR、DSD、EAC3、MP1、MP2、MP3、PCM、RealAudio、Vorbis、Windows Media Audio。 | |
文件大小 | 最大100 GB。 | |
色彩空間 | 4:2:2、4:2:0等。 | |
輸出文件 | 封裝格式 | 說明
|
編碼格式 |
| |
編碼級別 |
| |
分辨率 |
| |
碼率 |
| |
幀率 | 輸出幀率范圍為(0,60],單位為fps。 | |
采樣位深 |
| |
顏色格式 | yuv420p,yuvj420p,yuv422p,yuvj422p,yuv444p,yuvj444等。 | |
碼率控制 | VBR、CBR、ABR、CRF。 | |
掃描模式 | 支持原視頻模式、自動去隔行、交叉掃描、順序掃描。 |
窄帶高清TM
窄帶高清TM是一項基于阿里云轉(zhuǎn)碼技術(shù)的媒體處理功能,通過提高視頻壓縮率、減小文件體積,從而減少播放卡頓并節(jié)省存儲和流量費用。
以下功能需要在提交轉(zhuǎn)碼作業(yè)時選擇對應窄帶高清轉(zhuǎn)碼模板使用,按照輸出的視頻規(guī)格和時長,收取窄帶高清轉(zhuǎn)碼費用。計費說明請參見轉(zhuǎn)碼定價。
類型 | 說明 |
窄帶高清TM1.0 | 針對視頻畫面場景、動作、內(nèi)容、紋理等細節(jié)進行智能分析,實現(xiàn)在同等畫質(zhì)下平均節(jié)約20~40%碼率、在同等帶寬下更高清的觀看體驗。支持H.264、H.265編碼,其他參數(shù)同普通轉(zhuǎn)碼。單擊在線體驗。 |
窄帶高清TM2.0 | 突破視頻編碼器能力上限并融入輕量畫質(zhì)修復與增強能力,實現(xiàn)在同等畫質(zhì)下平均節(jié)約40%~60%碼率、在低帶寬下更高清優(yōu)質(zhì)的觀看體驗。支持H.264、H.265編碼,其他參數(shù)同普通轉(zhuǎn)碼。單擊在線體驗 |
音視頻增強
音頻增強
視頻云音頻實驗室有機結(jié)合傳統(tǒng)信號處理與深度學習技術(shù),提供全場景音頻增強與修復方案。單擊在線體驗。
以下功能需要在提交轉(zhuǎn)碼作業(yè)時配置相應參數(shù)使用,音頻部分按照輸出的音頻規(guī)格和時長,收取音視頻增強費用。視頻部分按照使用的服務,收取轉(zhuǎn)碼費用。計費說明請參見音視頻增強費用、轉(zhuǎn)碼費用。如需開啟音頻增強轉(zhuǎn)碼模板,請搜索釘釘群32171220入群聯(lián)系阿里云技術(shù)人員配置。
功能 | 說明 |
杜比音效 |
|
全景聲 | 全景聲空間音頻技術(shù),提供更加沉浸、真實的體驗。 |
虛擬環(huán)繞聲 | 支持將5.1/7.1多聲道音頻轉(zhuǎn)碼為雙聲道音頻,并保留多聲道環(huán)繞效果,實現(xiàn)在非家庭影院設備上播放(如使用手機、平板、耳機、電視)也可體驗到高質(zhì)量音源的環(huán)繞聲效果。 |
音效增強 | 支持對單/雙/5.1/7.1多聲道音頻進行效果增強,針對耳機、外放等不同播放環(huán)境,提供影視級品質(zhì)、自然、清晰、可定制的音效氛圍,適用于音樂、演講、影視內(nèi)容場景。 |
音量歸一 | 智能調(diào)節(jié)視頻響度,進行歸一化處理。解決短視頻、音樂連播場景下,因內(nèi)容源音量參差不齊,帶來音量忽大忽小的問題。 |
視頻增強
以下功能需要在提交轉(zhuǎn)碼作業(yè)時選擇對應視頻增強轉(zhuǎn)碼模板使用,按照輸出視頻的規(guī)格、幀數(shù)收取轉(zhuǎn)碼費用。計費說明請參見音視頻增強費用。如需開啟視頻增強轉(zhuǎn)碼模板,請搜索釘釘群32171220入群聯(lián)系阿里云技術(shù)人員配置。
從視頻清晰度、色彩、流暢性等維度進行全面提升,實現(xiàn)4K/8K超高清生產(chǎn)、標清轉(zhuǎn)高清、互聯(lián)網(wǎng)UGC內(nèi)容優(yōu)化、老舊視頻修復等典型媒體處理訴求。最終通過更高品質(zhì)的視聽內(nèi)容提升用戶體驗,帶來客戶轉(zhuǎn)化與觀看時長的提升。單擊在線體驗。
功能 | 說明 |
超分 | 采用超分辨率技術(shù),在還原更多畫面細節(jié)的同時修復模糊、噪聲等輕微損傷,同時針對人像區(qū)域進行重點還原。可將低清晰度的視頻生成720p或1080p的高清版本,將高清影片生成高品質(zhì)的2K或4K節(jié)目源。 |
插幀 | 采用智能分析+動態(tài)補償技術(shù),針對畫面運動的不同而采用智能插幀策略。實現(xiàn)最高120fps的無級插幀,解決由幀率帶來的平移卡頓、畫面抖動等問題。 |
視頻修復 | 對視頻在采集、壓縮、物理放映等環(huán)節(jié)導致的嚴重損傷問題,如壓縮噪聲、塊效應、劃痕、霉斑等進行智能修復,同時保持幀間穩(wěn)定性與細節(jié)還原性。 |
HDR |
|
SDR+ | SDR色彩增強技術(shù),在SDR色域下結(jié)合場景與內(nèi)容分析,對視頻曝光、對比度、飽和度、白平衡等維度進行智能優(yōu)化,在實現(xiàn)更優(yōu)主觀體驗的同時保持色彩的穩(wěn)定、統(tǒng)一。 |
倍速轉(zhuǎn)碼
將視頻源切分為多個較小的片段后并行轉(zhuǎn)碼,可將轉(zhuǎn)碼速度提升5~30倍,顯著縮短處理耗時,適用于對首發(fā)、時效性要求較高的資訊、賽事、重要內(nèi)容場景。
通過提交轉(zhuǎn)碼作業(yè)并啟用倍速管道為轉(zhuǎn)碼任務提速。除收取原本音視頻轉(zhuǎn)碼或音視頻增強費用外,會按輸出的視頻規(guī)格、時長和實際倍速,額外收取倍速費用。詳細計費說明,請參見倍速轉(zhuǎn)碼。
類型 | 說明 |
加速倍數(shù) | 根據(jù)輸入視頻情況,一般可達到5~30倍。支持在倍速管道上設置預期倍速,如5倍速、10倍速、20倍速、30倍速等。 |
適用視頻 | 推薦30分鐘以上的長視頻,或?qū)Ω邘省⒊咔濉⒁舢嬙鰪姷葟碗s處理的視頻采用倍速轉(zhuǎn)碼。詳細說明,請參見倍速轉(zhuǎn)碼使用限制。 |
倍速策略 | 并非所有視頻都支持切片,投遞到倍速管道中但不支持倍速的視頻,會默認退避到非倍速模式轉(zhuǎn)碼。 |
更多處理
媒體信息
獲取存儲于OSS上的音視頻文件信息,包括分辨率、碼率、幀率、編碼格式、文件格式等關(guān)鍵信息。
該功能需要通過提交媒體信息作業(yè)使用,按請求次數(shù),收取功能接口請求費用。計費說明,請參見功能接口請求定價。
簡單剪輯
對視頻進行提取音頻、提取視頻、拼接、剪輯、混音等簡單的二次創(chuàng)作。
以下功能需要通過提交轉(zhuǎn)碼作業(yè)時設置相應參數(shù)使用,按輸出的視頻規(guī)格和時長,收取轉(zhuǎn)碼費用。計費說明,請參見轉(zhuǎn)碼定價。
功能 | 說明 | API相關(guān)參數(shù) | 控制臺操作 |
提取音頻 | 從視頻文件中單獨分離出音頻,即禁用視頻。 | Remove | 支持 |
提取視頻 | 從視頻文件中單獨分離出視頻,即禁用音頻。 | Remove | 支持 |
視頻去黑邊 | 檢測視頻畫面中的黑邊,并自動剪裁。 | Crop | 不支持 |
視頻剪裁 | 指定輸入視頻畫面經(jīng)過剪裁后保留的寬度和高度,以及該保留畫面與輸入畫面左邊、上邊的相對距離,兩個畫面的間隙自動剪裁。 | Crop | 不支持 |
視頻貼黑邊 | 指定輸入視頻畫面經(jīng)過貼黑邊后輸出的寬度和高度,以及輸入畫面與輸出畫面左邊、上邊的相對位置,兩個畫面的間隙使用黑邊填充。 | Pad | 不支持 |
橫豎屏自適應 | 開啟后,輸出分辨率由寬度、高度,變?yōu)殚L邊、短邊參數(shù)。當您的輸入視頻同時包含橫屏、豎屏時建議開啟該參數(shù)。 | LongShortMode | 支持 |
視頻旋轉(zhuǎn) | 設置視頻旋轉(zhuǎn)角度。 | Rotate | 支持 |
視頻拼接 | 將最多100個視頻進行拼接,可設置每個被拼接視頻的開始、持續(xù)時間。 | MergeList或MergeConfigUrl | 不支持 |
視頻剪輯 |
| Clip | 支持 |
開場和關(guān)板 | 在視頻開頭疊加動態(tài)Logo,并指定片尾內(nèi)容。增加產(chǎn)品識別度,突出版權(quán)。 | OpeningList和TailSlateList | 支持添加片尾 |
模糊處理 | 對視頻內(nèi)的指定區(qū)域進行模糊處理。 | DeWatermark | 不支持 |
混音 | 實現(xiàn)兩音軌合并,適用于增加背景音樂場景。 | Amix | 不支持 |
視頻截圖
對視頻截取指定時間、指定尺寸的圖片,用于生產(chǎn)視頻封面、雪碧圖、播放器進度條縮略圖。
以下功能需要通過提交截圖作業(yè)使用,按截圖張數(shù),收取功能接口請求費用。計費說明,請參見功能接口請求定價。
功能 | 說明 | API相關(guān)參數(shù) | 控制臺操作 |
靜態(tài)截圖 | 對視頻截取指定時間、指定尺寸的JPG圖片。提供以下幾種采樣方式:
| SnapshotConfig | 支持 |
雪碧截圖 | 設置后,對截取的一系列靜態(tài)圖片,會按照指定的排列規(guī)則拼成一張大圖,這張大圖即為雪碧圖。格式為JPG。僅支持異步調(diào)用。通過一次請求雪碧圖可獲取多張圖片的信息,實現(xiàn)大幅降低圖片請求數(shù)量,提高客戶端性能。 | TileOut、TileOutputFile | 不支持 |
WebVTT截圖 | 設置后,對截取的一系列靜態(tài)圖片或雪碧圖,會生成VTT文件,文件包含截圖時間、截圖文件地址、雪碧圖坐標信息。在使用圖片時需要先獲取VTT文件,解析圖片的信息進行展示。可用于播放器進度條縮略圖展示。 | SubOut | 支持 |
關(guān)鍵幀截圖 | 設置后,只截取關(guān)鍵幀。如對應指定時間點為非關(guān)鍵幀,則就近選取關(guān)鍵幀。 | FrameType | 支持 |
首幀黑屏檢測 | 對于首幀圖片(time=0)可以使用黑屏檢測。通過設置黑色像素的畫面比例和顏色值定義黑屏。截圖時會檢測視頻的前5秒,如果有非黑屏圖片,則截取非黑屏圖片;否則,單圖任務返回失敗,多圖任務截取第一幀黑屏圖片。 | BlackLevel、PixelBlackThreshold | 支持 |
視頻水印(明水印)
在視頻中添加可見的明水印(例如,企業(yè)Logo、電視臺臺標),突出品牌和版權(quán),增加產(chǎn)品識別度。為視頻添加不可見的盲水印用于版權(quán)追溯,詳細說明請參見下文數(shù)字水印(暗水印)說明。
以下功能需要通過提交轉(zhuǎn)碼作業(yè)使用,指定水印素材和水印模板(可選)使用,按輸出的視頻規(guī)格和時長,收取轉(zhuǎn)碼費用;同時按水印個數(shù),收取功能接口請求費用。計費說明,請參見音視頻轉(zhuǎn)碼費用、功能接口請求定價。
功能 | 說明 | API相關(guān)參數(shù) | 控制臺操作 |
圖片水印 |
| WaterMarks | |
文字水印 | WaterMarks | 不支持 |
添加字幕
在視頻中添加字幕,在多語言片源、或視頻靜音或環(huán)境嘈雜的場景、或令聽障人士也能無障礙的理解和欣賞視頻。
以下功能需要通過提交轉(zhuǎn)碼作業(yè)或配置工作流發(fā)起轉(zhuǎn)碼使用,按輸出的視頻規(guī)格和時長,收取轉(zhuǎn)碼費用。計費說明,請參見音視頻轉(zhuǎn)碼費用。
功能 | 說明 | API相關(guān)參數(shù) | 控制臺操作 |
硬字幕 | 將字幕文件燒制到視頻畫面中,即把畫面的一部分像素替換為字幕內(nèi)容。字幕格式支持SRT、ASS格式,可設置字幕字體。硬字幕不依賴播放器,在所有場景下都可以播放顯示。 | SubtitleConfig | 不支持 |
打包字幕 | 通過工作流打包將字幕文件與音視頻流打包到同一個Master Playlist(m3u8或mpd文件)中,一個Master Playlis最多添加4路字幕,可以實現(xiàn)在播放器中切換多版本字幕的能力。字幕格式:HLS打包支持VTT,DASH打包支持VTT、STL、TTML。 |
| 支持 |
視頻打包
打包是指將多碼率、多音軌、多字幕、多音軌生成一個Master Playlist文件的過程。在流媒體播放場景下,可以實現(xiàn):
自適應碼流:根據(jù)網(wǎng)絡情況自適應碼流,可以解決起播慢、播放卡頓問題。
廣告植入:在兩個分片之間靈活插入視頻廣告。
以下功能需要通過配置工作流發(fā)起轉(zhuǎn)碼使用,按輸出的視頻規(guī)格、時長,收取轉(zhuǎn)碼費用。計費說明,請參見音視頻轉(zhuǎn)碼費用。
功能 | 說明 | API相關(guān)參數(shù) | 控制臺操作 |
HLS協(xié)議 | 使用Apple HLS協(xié)議進行打包,支持二級索引,索引文件格式為m3u8,視頻文件格式為ts。 | 支持 | |
DASH協(xié)議 | 使用DASH ISO協(xié)議進行打包,支持一級索引,索引文件格式為mpd,視頻文件格式為fmp4。 | 不支持 | |
CMAF協(xié)議 | 用CMAF協(xié)議進行打包,支持輸出HLS或DASH格式。 | 暫無 | 不支持 |
自定義分片時長 | 指定最多10個分片時間點,和其余時長的分片間隔。范圍1至60秒。有助于用戶根據(jù)播放端帶寬條件來設定切片時長,降低用戶首屏加載時間。 | Segment | 不支持 |
視頻加密
以下功能需要通過配置工作流發(fā)起轉(zhuǎn)碼使用,按輸出的視頻規(guī)格、時長,收取轉(zhuǎn)碼費用。計費說明,請參見音視頻轉(zhuǎn)碼費用。
功能 | 說明 | API相關(guān)參數(shù) | 控制臺操作 |
HLS標準加密 | 將視頻內(nèi)容按照HLS AES-128標準協(xié)議進行加密,密鑰支持自建或使用KMS服務,在HLS規(guī)定的播放器上均可解密播放。可保障移動端視頻安全。具有安全級別較高、終端兼容性好的優(yōu)點。 | 不涉及 | 支持 |
阿里云私有加密 | 將視頻文件按照阿里云私有加密協(xié)議進行加密,轉(zhuǎn)成加密的HLS格式,密鑰必須使用KMS服務,播放必須使用阿里云播放器進行解密播放,即使將文件下載到本地也無法播放和二次傳播。可保障移動端、FLASH端視頻安全。具有安全級別高,適用于在線教育,付費觀看等場景。 | 不涉及 | 支持 |
視頻AI
智能生產(chǎn)
基于阿里云媒體AI技術(shù),提供多種形式的媒體內(nèi)容處理及內(nèi)容生成能力,提升媒體內(nèi)容生產(chǎn)效率和質(zhì)量。單擊在線體驗。
以下功能需要通過提交智能生產(chǎn)作業(yè)使用,按成功處理的視頻時長,收取智能生產(chǎn)費用。計費說明,請參見智能生產(chǎn)計費。
處理類型 | 功能 | 服務名稱 | 說明 |
音頻類處理 | 副歌檢測 | MusicSegmentDetect | 對歌曲進行段落分析,識別音樂中的副歌“高潮片段”,提取副歌段落時間信息,可以用于音樂推薦試聽,熱門片段K歌等場景。 |
節(jié)奏檢測 | AudioBeatDetection | 節(jié)奏檢測可分析識別音樂中的多層次的節(jié)奏點,返回節(jié)奏點時間信息,可用于音視頻生產(chǎn)、音樂推薦等場景。 | |
智能混音 | AudioMixing | 對多個輸入音頻進行音軌平衡處理及智能混音,輸出混音合成音頻,支持人聲、音樂等多種音頻處理。 | |
音質(zhì)檢測 | AudioQualityAssessment | 識別輸入音頻靜音、卡頓等問題。 | |
智能降噪 | SpeechDenoise | 純凈人聲在現(xiàn)實生活中會受到各種噪聲干擾,使用智能降噪插件可以將噪聲濾除并保持極高的語音保真度,從而提升語音質(zhì)量和可懂度,為在線會議、在線教育等實時通信場景提供卓越的語音體驗。 | |
聲伴分離 | MusicDemix | 識別音頻中的人聲和伴奏,快速分離成兩個獨立的音頻文件。適用于卡拉ok的清唱、伴奏提取,任意音頻的背景音提取,滿足音頻素材獲取、后期制作、聲音剪輯等需求。 | |
視頻類處理 | 智能封面 | Cover | 封面圖片:選取展現(xiàn)視頻內(nèi)容效果最優(yōu)的圖片,作為視頻的圖片封面。 封面動圖:提取視頻多幀精彩瞬間,拼接生成GIF動圖,作為視頻的動圖封面。 |
視頻摘要 | VideoClip | 提取視頻精彩內(nèi)容片段,融合生成最具代表性的5s短視頻摘要。 | |
字幕提取 | CaptionExtraction | 識別視頻中的字幕,提取文本內(nèi)容及時間信息,輸出為srt字幕文件,支持中英文字幕識別提取,可用于視頻字幕加工場景。 | |
字幕擦除 | VideoDetext | 采用文字檢測及圖像融合處理技術(shù),智能檢測并去除視頻或圖像中的文字字幕,還原視頻純凈畫面。 | |
圖標模糊 | VideoDelogo | 識別視頻中的logo圖標位置,并對圖標進行模糊處理,恢復視頻未添加logo的原始狀態(tài),輔助視頻內(nèi)容的后期制作及再生產(chǎn)。 | |
視頻橫轉(zhuǎn)豎 | VideoH2V | 識別視頻畫面主體,進行比例適應裁剪,將橫屏拍攝的視頻轉(zhuǎn)換成適于移動端豎屏播放的視頻,助力移動時代視頻內(nèi)容二次生產(chǎn)及多端傳播投放。 | |
綠幕摳圖 | VideoGreenScreenMatting | 綠幕摳圖對視頻圖像的畫面前景背景進行分析提取,檢測純色背景并替換為指定的背景圖,適用于影視制作、短視頻制作及后期編輯場景。 | |
視頻美顏 | FaceBeauty | 基于智能視覺算法、人臉檢測識別技術(shù),提供視頻文件的人臉美顏功能,支持自動檢測并對人像進行磨皮、美白、紅潤等美顏處理,各項美顏參數(shù)可進行單獨設置,適用于短視頻制作、視頻后期處理等場景。 | |
圖片類處理 | 圖標模糊 | ImageDelogo | 識別圖片中的logo圖標位置,并對圖標進行模糊處理,恢復圖片未添加logo的原始態(tài)。 |
圖片橫轉(zhuǎn)豎 | ImageH2V | 識別圖片畫面主體,進行比例適應裁剪,將橫屏圖片轉(zhuǎn)換成適于移動端豎屏瀏覽的圖片。 | |
人臉風格化 | ImageCartoonize | 對圖片中的人臉進行風格化轉(zhuǎn)換,支持二次元、美漫等風格。 |
智能標簽
分析媒體文件中的視覺、文字、語音、行為等信息,結(jié)合多模態(tài)信息融合及對齊技術(shù),實現(xiàn)高準確率內(nèi)容識別,自動輸出多維度、結(jié)構(gòu)化標簽。應用于視頻搜索、個性化推薦、廣告投放等場景。單擊在線體驗。
以下功能需要通過提交智能標簽作業(yè)使用,按成功處理的視頻時長,收取智能標簽費用。計費說明,請參見智能標簽計費。
功能 | 說明 |
視頻分類 | 分析視頻內(nèi)容輸出視頻分類類目。 |
內(nèi)容標簽識別 | 分析視頻的視覺圖像信息,識別人物、物體、場景、等畫面內(nèi)容標簽。 |
視頻文字識別標簽OCR | 識別視頻圖像中的文字,提取圖像文本內(nèi)容。 |
視頻語音識別標簽ASR | 分析視頻中的語音信息,提取語音文本內(nèi)容。 |
自定義標簽 | 支持自定義人臉、地標、Logo、商品等標簽。 |
智能標簽輸入文件限制如下:
文件參數(shù) | 視頻 | 音頻 | 圖片 |
封裝格式 | AVI、FLV、MKV、MPG、MP4、TS、MOV、MXF | MP3、WAV | JPG、JPEG、PNG |
編碼格式 | MPEG2、MPEG-4、H.264/AVC、H.265/HEVC | 不涉及 | 不涉及 |
文件時長 | 不超過4小時 | 不超過4小時 | 不涉及 |
文件大小 | 不超過4 GB | 不超過400 MB | 不超過4 MB |
文件分辨率 | 240P~2160P,為保證分析效果,建議分辨率不小于720P | 不涉及 | 不超過2160P |
智能審核
對媒體文件的標題、簡介、封面、視頻、音頻等內(nèi)容進行審核,有效識別違規(guī)內(nèi)容。應用于短視頻平臺、直播平臺、傳媒審核等場景。單擊立即體驗。
以下功能需要通過提交媒體審核作業(yè)使用,按成功處理的視頻時長,收取智能審核費用。計費說明,請參見視頻AI費用。
功能 | 審核內(nèi)容 | 說明 |
媒體內(nèi)容審核 | 涉黃識別 | 識別語音、文字、畫面中的色情和性感內(nèi)容。 |
暴恐涉政識別 | 識別武器、血腥場面、特殊裝束、爆炸煙光、特殊標識、聚眾、游行等十余個維度的暴恐涉政內(nèi)容。 | |
廣告/二維碼識別 | 識別媒體文件中的文字、水印、二維碼,有效識別牛皮癬廣告、二維碼、小程序碼等多種形式的圖文廣告。 | |
Logo識別 | 識別視頻圖片中的各種Logo圖標,如臺標、商標、水印等,常用于版權(quán)保護等場景。 | |
不良場景識別 | 識別畫中畫、吸煙、車內(nèi)直播、無意義畫面等需要監(jiān)管的不良場景。 | |
語音垃圾識別 | 識別語音中存在的涉黃、暴恐涉政、辱罵等違規(guī)信息,支持中文、英文語音識別。 |
視頻DNA
基于阿里云視頻指紋技術(shù),通過指紋特征來唯一標記一個視頻/音頻/圖片/文本,提供視頻、圖像、音頻等指紋特征提取、對比功能,可以解決重復視頻查找、視頻片段查源等問題。單擊立即體驗。
以下功能需要通過提交DNA作業(yè)使用,按成功處理的音視頻時長,收取視頻DNA費用。計費說明,請參見視頻DNA計費。
功能 | 說明 |
視頻DNA | 提取視頻畫面指紋,支持入庫分析及指紋特征比對,查找?guī)靸?nèi)相似視頻。 |
音頻DNA | 提取音頻指紋,支持入庫分析及指紋特征比對,查找?guī)靸?nèi)相似音頻。 |
圖片DNA | 提取圖片畫面指紋,支持入庫分析及指紋特征比對,查找?guī)靸?nèi)相似圖片。 |
文本DNA | 提取文本內(nèi)容指紋,支持入庫分析及指紋特征比對,查找?guī)靸?nèi)相似文本。 |
數(shù)字水印(暗水印)
基于阿里云數(shù)字水印技術(shù),支持對視頻進行數(shù)字信息的嵌入、提取。嵌入的水印信息隱藏于載體文件中,水印嵌入后不影響視頻畫面、圖片的視覺質(zhì)量及完整性,可用于版權(quán)保護、泄露溯源、廣播監(jiān)視、信息傳輸、文件驗真等多種場景。詳細說明,請參見數(shù)字水印(暗水印)。
以下功能需要通過提交視頻版權(quán)水印/溯源水印作業(yè)使用,按成功處理的音視頻時長,收取數(shù)字水印費用。計費說明,請參見數(shù)字水印計費。
功能 | 說明 | 相關(guān)API | 控制臺操作 |
視頻版權(quán)水印 | 為視頻(僅支持3分鐘及以上的視頻 )嵌入不可見的指定文字信息,嵌入的數(shù)字水印隱藏于媒體文件中,不影響視頻的視覺質(zhì)量及完整性。當視頻被傳播、加工后,依然可以提取識別嵌入的文字信息。 | 不支持 | |
視頻溯源水印 | 為視頻(僅支持3分鐘及以上的視頻)轉(zhuǎn)碼輸出A流和B流兩個HLS文件,兩路流被嵌入的溯源水印內(nèi)容不同。用戶請求播放時,隨機選擇AB流的分片及逆行組合,實時生成與用戶身份唯一對應的溯源水印M3U8文件。當發(fā)生視頻盜版時,只要檢測其中的水印信息就可以追蹤到泄露視頻的用戶,盜版權(quán)責追溯。 | 不支持 |
服務管理
類別 | 說明 | API相關(guān)參數(shù) | 控制臺操作 |
媒體管理 | 媒體視頻文件上傳、管理與發(fā)布。 | 不涉及 | 不涉及 |
工作流編排 | 云端自動化處理工作流,音視頻上傳完畢后自動執(zhí)行處理流程。 | 不涉及 | 支持 |
轉(zhuǎn)碼模板 | 轉(zhuǎn)碼模板是一系列轉(zhuǎn)碼參數(shù)的集合,在創(chuàng)建轉(zhuǎn)碼任務或使用工作流時,可以使用轉(zhuǎn)碼模板簡化操作。按創(chuàng)建來源分為自定義模板、定制模板、系統(tǒng)預置模板。 | TemplateId | 支持 |
水印模板 | 水印模板是一系列包含水印位置、大小的參數(shù),使用水印模板,可以幫助您簡化開發(fā)操作。 | WaterMarkTemplateId | 支持 |
轉(zhuǎn)碼優(yōu)先級 | 設置任務在管道內(nèi)的轉(zhuǎn)碼優(yōu)先級,最多分為10級。 | Priority | 不支持 |
條件轉(zhuǎn)碼 | 對比原視頻的視頻碼率、視頻分辨率、音頻碼率是否小于指定輸出設置,如果小于則按原畫或不轉(zhuǎn)碼。 | IsCheckReso、IsCheckResoFail等 | 支持 |
管道隊列 | 媒體處理轉(zhuǎn)碼、異步截圖等作業(yè)為異步處理,需要加入管道中被調(diào)度執(zhí)行。支持創(chuàng)建多個任務管道,并設置任務在管道內(nèi)的轉(zhuǎn)碼優(yōu)先級,最多分為10級。 | Priority | 不支持 |
消息通知 | 媒體處理轉(zhuǎn)碼、異步截圖等作業(yè)為異步處理。通過集成MNS服務,為管道或工作流綁定主題或隊列通知,當任務完成、工作流開始和結(jié)束時會通過MNS主動推送給用戶。 | NotifyConfig | 支持 |
數(shù)據(jù)統(tǒng)計 | 查詢指定時間段使用的轉(zhuǎn)碼、截圖、視頻審核、視頻DNA的用量時長。 | 不涉及 | 不涉及 |