日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

媒體處理可以將一個音視頻文件轉(zhuǎn)換成另一個或多個音視頻文件,以適應不同網(wǎng)絡帶寬、終端設備和用戶的需求。對媒體的內(nèi)容、文字、語音、場景進行多模態(tài)分析,實現(xiàn)智能審核、內(nèi)容理解、智能編輯等多種處理功能。

音視頻轉(zhuǎn)碼

把音視頻碼流轉(zhuǎn)換為另一種清晰度、編碼格式或封裝格式,以適應不同網(wǎng)絡帶寬、不同終端播放設備的使用場景。媒體處理覆蓋了主流編碼及封裝格式,并且支持在轉(zhuǎn)碼過程中添加水印、字幕、簡單剪輯等處理,詳見下文。未在控制臺或API展示的功能,請通過商務人員聯(lián)系技術(shù)團隊。

重要

以下功能需要提交轉(zhuǎn)碼作業(yè)使用,按照輸出的視頻規(guī)格和時長,收取普通轉(zhuǎn)碼費用。計費說明請參見轉(zhuǎn)碼定價

參數(shù)

類型

說明

輸入文件

封裝格式

  • 視頻:3GP、AVI、FLV、MP4、M3U8、MPG、ASF、WMV、MKV、MOV、TS、WebM、MXF、VOB。

  • 音頻:AAC、FLAC、M4A、MP3、MP4、OGG。

  • 字幕:ASS、SSA、SRT、VTT。

視頻編碼格式

Apple ProRes、AVS+、AVS、AVS2、H.263、 H.263+、H.264/AVC、H.265/HEVC、H.266/VVC、MJPEG、MPEG-1、MPEG-2、MPEG-4、Quicktime、RealVideo、VP8、VP9、Windows Media Video。

音頻編碼格式

AAC、AC3、ADPCM、AMR、DSD、EAC3、MP1、MP2、MP3、PCM、RealAudio、Vorbis、Windows Media Audio。

文件大小

最大100 GB。

色彩空間

4:2:2、4:2:0等。

輸出文件

封裝格式

說明
  • 封裝格式與編碼格式需要搭配使用,支持規(guī)則請參見格式支持。未在控制臺或API展示的功能請通過商務人員聯(lián)系技術(shù)團隊。

  • 轉(zhuǎn)封裝不改變音視頻流的編碼方式,僅改變封裝格式。支持輸出MP4、HLS、FLV三種格式。

  • 視頻:HLS、DASH、CMAF、3GP、AVI、FLV、F4V、fMP4、MKV、MOV、MP4、MPEG、TS、MXF、WebM。

  • 動圖:GIF、WEBP。

  • 音頻:AAC、M4A、MP2、MP3、MP4、OGG、FLAC、WAV。

編碼格式

  • 視頻:H.263、H.264/AVC、 H.265/HEVC、H.266/VVC、VP8、VP9、AV1、AVC-Introa、AVS2、MPEG-1、MPEG-2、MPEG-2 422、MPEG-4、Apple ProRes。

  • 動圖:GIF、WEBP。

  • 音頻:AAC、AC3、EAC3、MP2、MP3、FLAC、OPUS、VORBIS、Windows Media Audio、pcm_s16le。

編碼級別

  • H.264支持Baseline、Main、High三種編碼級別。

  • AAC支持aac_low、aac_he、aac_he_v2、aac_ld、aac_eld五種編碼級別。

分辨率

  • H.264輸出分辨率范圍為[128,4096],單位為px。

  • H.265、H.266、AV1輸出分辨率范圍為[128,8192],單位為px。

碼率

  • H.264輸出碼率范圍為[10,50000],單位為Kbps。

  • H.265、H.266、AV1輸出碼率范圍為[10,200000],單位為Kbps。

幀率

輸出幀率范圍為(0,60],單位為fps。

采樣位深

  • H.264支持8bit。

  • H.265支持最高12bit。

顏色格式

yuv420p,yuvj420p,yuv422p,yuvj422p,yuv444p,yuvj444等。

碼率控制

VBR、CBR、ABR、CRF。

掃描模式

支持原視頻模式、自動去隔行、交叉掃描、順序掃描。

窄帶高清TM

窄帶高清TM是一項基于阿里云轉(zhuǎn)碼技術(shù)的媒體處理功能,通過提高視頻壓縮率、減小文件體積,從而減少播放卡頓并節(jié)省存儲和流量費用。

重要

以下功能需要在提交轉(zhuǎn)碼作業(yè)時選擇對應窄帶高清轉(zhuǎn)碼模板使用,按照輸出的視頻規(guī)格和時長,收取窄帶高清轉(zhuǎn)碼費用。計費說明請參見轉(zhuǎn)碼定價

類型

說明

窄帶高清TM1.0

針對視頻畫面場景、動作、內(nèi)容、紋理等細節(jié)進行智能分析,實現(xiàn)在同等畫質(zhì)下平均節(jié)約20~40%碼率、在同等帶寬下更高清的觀看體驗。支持H.264、H.265編碼,其他參數(shù)同普通轉(zhuǎn)碼。單擊在線體驗

窄帶高清TM2.0

突破視頻編碼器能力上限并融入輕量畫質(zhì)修復與增強能力,實現(xiàn)在同等畫質(zhì)下平均節(jié)約40%~60%碼率、在低帶寬下更高清優(yōu)質(zhì)的觀看體驗。支持H.264、H.265編碼,其他參數(shù)同普通轉(zhuǎn)碼。單擊在線體驗

頻增強

音頻增強

視頻云音頻實驗室有機結(jié)合傳統(tǒng)信號處理與深度學習技術(shù),提供全場景音頻增強與修復方案。單擊在線體驗

重要

以下功能需要在提交轉(zhuǎn)碼作業(yè)配置相應參數(shù)使用,音頻部分按照輸出的音頻規(guī)格和時長,收取音視頻增強費用。視頻部分按照使用的服務,收取轉(zhuǎn)碼費用。計費說明請參見音視頻增強費用轉(zhuǎn)碼費用如需開啟音頻增強轉(zhuǎn)碼模板,請搜索釘釘群32171220入群聯(lián)系阿里云技術(shù)人員配置。

功能

說明

杜比音效

  • 杜比音效制作:支持將普通音頻轉(zhuǎn)碼為杜比格式(音頻編碼格式為AC3、EAC3),配合阿里云播放器SDK可以在杜比設備上開啟杜比專屬音效。本功能按杜比音效制作計費。

  • 杜比音效兼容:支持杜比格式兼容為普通格式,實現(xiàn)杜比片源在非杜比設備順利播放效果。本功能按音頻轉(zhuǎn)碼計費。

全景聲

全景聲空間音頻技術(shù),提供更加沉浸、真實的體驗。

虛擬環(huán)繞聲

支持將5.1/7.1多聲道音頻轉(zhuǎn)碼為雙聲道音頻,并保留多聲道環(huán)繞效果,實現(xiàn)在非家庭影院設備上播放(如使用手機、平板、耳機、電視)也可體驗到高質(zhì)量音源的環(huán)繞聲效果。

音效增強

支持對單/雙/5.1/7.1多聲道音頻進行效果增強,針對耳機、外放等不同播放環(huán)境,提供影視級品質(zhì)、自然、清晰、可定制的音效氛圍,適用于音樂、演講、影視內(nèi)容場景。

音量歸一

智能調(diào)節(jié)視頻響度,進行歸一化處理。解決短視頻、音樂連播場景下,因內(nèi)容源音量參差不齊,帶來音量忽大忽小的問題。

視頻增強

重要

以下功能需要在提交轉(zhuǎn)碼作業(yè)時選擇對應視頻增強轉(zhuǎn)碼模板使用,按照輸出視頻的規(guī)格、幀數(shù)收取轉(zhuǎn)碼費用。計費說明請參見音視頻增強費用如需開啟視頻增強轉(zhuǎn)碼模板,請搜索釘釘群32171220入群聯(lián)系阿里云技術(shù)人員配置。

從視頻清晰度、色彩、流暢性等維度進行全面提升,實現(xiàn)4K/8K超高清生產(chǎn)、標清轉(zhuǎn)高清、互聯(lián)網(wǎng)UGC內(nèi)容優(yōu)化、老舊視頻修復等典型媒體處理訴求。最終通過更高品質(zhì)的視聽內(nèi)容提升用戶體驗,帶來客戶轉(zhuǎn)化與觀看時長的提升。單擊在線體驗

功能

說明

超分

采用超分辨率技術(shù),在還原更多畫面細節(jié)的同時修復模糊、噪聲等輕微損傷,同時針對人像區(qū)域進行重點還原。可將低清晰度的視頻生成720p或1080p的高清版本,將高清影片生成高品質(zhì)的2K或4K節(jié)目源。

插幀

采用智能分析+動態(tài)補償技術(shù),針對畫面運動的不同而采用智能插幀策略。實現(xiàn)最高120fps的無級插幀,解決由幀率帶來的平移卡頓、畫面抖動等問題。

視頻修復

對視頻在采集、壓縮、物理放映等環(huán)節(jié)導致的嚴重損傷問題,如壓縮噪聲、塊效應、劃痕、霉斑等進行智能修復,同時保持幀間穩(wěn)定性與細節(jié)還原性。

HDR

  • SDR轉(zhuǎn)HDR技術(shù),將SDR視頻進行全自動色域變化與提升,實現(xiàn)HDR色彩、BT.2020色域、10bit位深。

  • HDR轉(zhuǎn)SDR技術(shù),將HDR視頻兼容為普通設備也可播放的SDR,解決畫面過曝偏色問題。

SDR+

SDR色彩增強技術(shù),在SDR色域下結(jié)合場景與內(nèi)容分析,對視頻曝光、對比度、飽和度、白平衡等維度進行智能優(yōu)化,在實現(xiàn)更優(yōu)主觀體驗的同時保持色彩的穩(wěn)定、統(tǒng)一。

倍速轉(zhuǎn)碼

將視頻源切分為多個較小的片段后并行轉(zhuǎn)碼,可將轉(zhuǎn)碼速度提升5~30倍,顯著縮短處理耗時,適用于對首發(fā)、時效性要求較高的資訊、賽事、重要內(nèi)容場景。

重要

通過提交轉(zhuǎn)碼作業(yè)并啟用倍速管道為轉(zhuǎn)碼任務提速。除收取原本音視頻轉(zhuǎn)碼或音視頻增強費用外,會按輸出的視頻規(guī)格、時長和實際倍速,額外收取倍速費用。詳細計費說明,請參見倍速轉(zhuǎn)碼

類型

說明

加速倍數(shù)

根據(jù)輸入視頻情況,一般可達到5~30倍。支持在倍速管道上設置預期倍速,如5倍速、10倍速、20倍速、30倍速等。

適用視頻

推薦30分鐘以上的長視頻,或?qū)Ω邘省⒊咔濉⒁舢嬙鰪姷葟碗s處理的視頻采用倍速轉(zhuǎn)碼。詳細說明,請參見倍速轉(zhuǎn)碼使用限制

倍速策略

并非所有視頻都支持切片,投遞到倍速管道中但不支持倍速的視頻,會默認退避到非倍速模式轉(zhuǎn)碼。

更多處理

媒體信息

獲取存儲于OSS上的音視頻文件信息,包括分辨率、碼率、幀率、編碼格式、文件格式等關(guān)鍵信息。

重要

該功能需要通過提交媒體信息作業(yè)使用,按請求次數(shù),收取功能接口請求費用。計費說明,請參見功能接口請求定價

簡單剪輯

對視頻進行提取音頻、提取視頻、拼接、剪輯、混音等簡單的二次創(chuàng)作。

重要

以下功能需要通過提交轉(zhuǎn)碼作業(yè)時設置相應參數(shù)使用,按輸出的視頻規(guī)格和時長,收取轉(zhuǎn)碼費用。計費說明,請參見轉(zhuǎn)碼定價

功能

說明

API相關(guān)參數(shù)

控制臺操作

提取音頻

從視頻文件中單獨分離出音頻,即禁用視頻。

Remove

支持

提取視頻

從視頻文件中單獨分離出視頻,即禁用音頻。

Remove

支持

視頻去黑邊

檢測視頻畫面中的黑邊,并自動剪裁。

Crop

不支持

視頻剪裁

指定輸入視頻畫面經(jīng)過剪裁后保留的寬度和高度,以及該保留畫面與輸入畫面左邊、上邊的相對距離,兩個畫面的間隙自動剪裁。

Crop

不支持

視頻貼黑邊

指定輸入視頻畫面經(jīng)過貼黑邊后輸出的寬度和高度,以及輸入畫面與輸出畫面左邊、上邊的相對位置,兩個畫面的間隙使用黑邊填充。

Pad

不支持

橫豎屏自適應

開啟后,輸出分辨率由寬度、高度,變?yōu)殚L邊、短邊參數(shù)。當您的輸入視頻同時包含橫屏、豎屏時建議開啟該參數(shù)。

LongShortMode

支持

視頻旋轉(zhuǎn)

設置視頻旋轉(zhuǎn)角度。

Rotate

支持

視頻拼接

將最多100個視頻進行拼接,可設置每個被拼接視頻的開始、持續(xù)時間。

MergeList或MergeConfigUrl

不支持

視頻剪輯

  • 視頻片段剪輯:從指定時間點,開始截取指定時長的視頻。

  • 片尾剪輯:截掉指定時長的片尾。

Clip

支持

開場和關(guān)板

在視頻開頭疊加動態(tài)Logo,并指定片尾內(nèi)容。增加產(chǎn)品識別度,突出版權(quán)。

OpeningList和TailSlateList

支持添加片尾

模糊處理

對視頻內(nèi)的指定區(qū)域進行模糊處理。

DeWatermark

不支持

混音

實現(xiàn)兩音軌合并,適用于增加背景音樂場景。

Amix

不支持

視頻截圖

對視頻截取指定時間、指定尺寸的圖片,用于生產(chǎn)視頻封面、雪碧圖、播放器進度條縮略圖。

重要

以下功能需要通過提交截圖作業(yè)使用,按截圖張數(shù),收取功能接口請求費用。計費說明,請參見功能接口請求定價

功能

說明

API相關(guān)參數(shù)

控制臺操作

靜態(tài)截圖

對視頻截取指定時間、指定尺寸的JPG圖片。提供以下幾種采樣方式:

  • 單張截圖:在指定時間點截取一張圖片。支持同步或異步調(diào)用。

  • 采樣截圖:指定截圖數(shù)量和間隔,從指定時間點開始,每隔指定時長(秒)就截取一張截圖,截夠指定數(shù)量或截到視頻結(jié)尾停止。僅支持異步調(diào)用。

  • 平均截圖:指定截圖數(shù)量,從指定時間點開始,按相同的時間間隔進行截圖,截到視頻結(jié)尾停止。僅支持異步調(diào)用。

  • 時間點截圖:指定一組時間點,按這些時間點進行截圖。僅支持異步調(diào)用。

SnapshotConfig

支持

雪碧截圖

設置后,對截取的一系列靜態(tài)圖片,會按照指定的排列規(guī)則拼成一張大圖,這張大圖即為雪碧圖。格式為JPG。僅支持異步調(diào)用。通過一次請求雪碧圖可獲取多張圖片的信息,實現(xiàn)大幅降低圖片請求數(shù)量,提高客戶端性能。

TileOut、TileOutputFile

不支持

WebVTT截圖

設置后,對截取的一系列靜態(tài)圖片或雪碧圖,會生成VTT文件,文件包含截圖時間、截圖文件地址、雪碧圖坐標信息。在使用圖片時需要先獲取VTT文件,解析圖片的信息進行展示。可用于播放器進度條縮略圖展示。

SubOut

支持

關(guān)鍵幀截圖

設置后,只截取關(guān)鍵幀。如對應指定時間點為非關(guān)鍵幀,則就近選取關(guān)鍵幀。

FrameType

支持

首幀黑屏檢測

對于首幀圖片(time=0)可以使用黑屏檢測。通過設置黑色像素的畫面比例和顏色值定義黑屏。截圖時會檢測視頻的前5秒,如果有非黑屏圖片,則截取非黑屏圖片;否則,單圖任務返回失敗,多圖任務截取第一幀黑屏圖片。

BlackLevel、PixelBlackThreshold

支持

視頻水印(明水印)

在視頻中添加可見的明水印(例如,企業(yè)Logo、電視臺臺標),突出品牌和版權(quán),增加產(chǎn)品識別度。為視頻添加不可見的盲水印用于版權(quán)追溯,詳細說明請參見下文數(shù)字水印(暗水印)說明。

重要

以下功能需要通過提交轉(zhuǎn)碼作業(yè)使用,指定水印素材和水印模板(可選)使用,按輸出的視頻規(guī)格和時長,收取轉(zhuǎn)碼費用;同時按水印個數(shù),收取功能接口請求費用。計費說明,請參見音視頻轉(zhuǎn)碼費用功能接口請求定價

功能

說明

API相關(guān)參數(shù)

控制臺操作

圖片水印

  • 單個視頻最多添加4組水印,支持設置水印開始時間、持續(xù)時長、出現(xiàn)的固定位置、水印大小。

  • 圖片水印支持PNG靜態(tài)圖片(擴展名.png)、PNG動圖(擴展名.apng)、MOV文件(擴展名.mov)、GIF文件(擴展名.gif)。

  • 支持使用水印模板簡化開發(fā)。

WaterMarks

支持

文字水印

  • 單個視頻最多添加4組水印,支持設置水印開始時間、持續(xù)時長、出現(xiàn)的固定位置、水印大小。

  • 文字水印可設置文字內(nèi)容、字號、字體、顏色、透明度、描邊效果等。支持的字體及顏色請參見字體支持顏色

  • 不支持使用水印模板。

WaterMarks

不支持

添加字幕

在視頻中添加字幕,在多語言片源、或視頻靜音或環(huán)境嘈雜的場景、或令聽障人士也能無障礙的理解和欣賞視頻。

重要

以下功能需要通過提交轉(zhuǎn)碼作業(yè)配置工作流發(fā)起轉(zhuǎn)碼使用,按輸出的視頻規(guī)格和時長,收取轉(zhuǎn)碼費用。計費說明,請參見音視頻轉(zhuǎn)碼費用

功能

說明

API相關(guān)參數(shù)

控制臺操作

硬字幕

將字幕文件燒制到視頻畫面中,即把畫面的一部分像素替換為字幕內(nèi)容。字幕格式支持SRT、ASS格式,可設置字幕字體。硬字幕不依賴播放器,在所有場景下都可以播放顯示。

SubtitleConfig

不支持

打包字幕

通過工作流打包將字幕文件與音視頻流打包到同一個Master Playlist(m3u8或mpd文件)中,一個Master Playlis最多添加4路字幕,可以實現(xiàn)在播放器中切換多版本字幕的能力。字幕格式:HLS打包支持VTT,DASH打包支持VTT、STL、TTML。

  • HLS打包:ExtXMedia

  • DASH打包:inputconfig

支持

視頻打包

打包是指將多碼率、多音軌、多字幕、多音軌生成一個Master Playlist文件的過程。在流媒體播放場景下,可以實現(xiàn):

  • 自適應碼流:根據(jù)網(wǎng)絡情況自適應碼流,可以解決起播慢、播放卡頓問題。

  • 廣告植入:在兩個分片之間靈活插入視頻廣告。

重要

以下功能需要通過配置工作流發(fā)起轉(zhuǎn)碼使用,按輸出的視頻規(guī)格、時長,收取轉(zhuǎn)碼費用。計費說明,請參見音視頻轉(zhuǎn)碼費用

功能

說明

API相關(guān)參數(shù)

控制臺操作

HLS協(xié)議

使用Apple HLS協(xié)議進行打包,支持二級索引,索引文件格式為m3u8,視頻文件格式為ts。

參見如何進行HLS打包

支持

DASH協(xié)議

使用DASH ISO協(xié)議進行打包,支持一級索引,索引文件格式為mpd,視頻文件格式為fmp4。

參見如何進行DASH打包

不支持

CMAF協(xié)議

用CMAF協(xié)議進行打包,支持輸出HLS或DASH格式。

暫無

不支持

自定義分片時長

指定最多10個分片時間點,和其余時長的分片間隔。范圍1至60秒。有助于用戶根據(jù)播放端帶寬條件來設定切片時長,降低用戶首屏加載時間。

Segment

不支持

視頻加密

重要

以下功能需要通過配置工作流發(fā)起轉(zhuǎn)碼使用,按輸出的視頻規(guī)格、時長,收取轉(zhuǎn)碼費用。計費說明,請參見音視頻轉(zhuǎn)碼費用

功能

說明

API相關(guān)參數(shù)

控制臺操作

HLS標準加密

將視頻內(nèi)容按照HLS AES-128標準協(xié)議進行加密,密鑰支持自建或使用KMS服務,在HLS規(guī)定的播放器上均可解密播放。可保障移動端視頻安全。具有安全級別較高、終端兼容性好的優(yōu)點。

不涉及

支持

阿里云私有加密

將視頻文件按照阿里云私有加密協(xié)議進行加密,轉(zhuǎn)成加密的HLS格式,密鑰必須使用KMS服務,播放必須使用阿里云播放器進行解密播放,即使將文件下載到本地也無法播放和二次傳播。可保障移動端、FLASH端視頻安全。具有安全級別高,適用于在線教育,付費觀看等場景。

不涉及

支持

視頻AI

智能生產(chǎn)

基于阿里云媒體AI技術(shù),提供多種形式的媒體內(nèi)容處理及內(nèi)容生成能力,提升媒體內(nèi)容生產(chǎn)效率和質(zhì)量。單擊在線體驗

重要

以下功能需要通過提交智能生產(chǎn)作業(yè)使用,按成功處理的視頻時長,收取智能生產(chǎn)費用。計費說明,請參見智能生產(chǎn)計費

處理類型

功能

服務名稱

說明

音頻類處理

副歌檢測

MusicSegmentDetect

對歌曲進行段落分析,識別音樂中的副歌“高潮片段”,提取副歌段落時間信息,可以用于音樂推薦試聽,熱門片段K歌等場景。

節(jié)奏檢測

AudioBeatDetection

節(jié)奏檢測可分析識別音樂中的多層次的節(jié)奏點,返回節(jié)奏點時間信息,可用于音視頻生產(chǎn)、音樂推薦等場景。

智能混音

AudioMixing

對多個輸入音頻進行音軌平衡處理及智能混音,輸出混音合成音頻,支持人聲、音樂等多種音頻處理。

音質(zhì)檢測

AudioQualityAssessment

識別輸入音頻靜音、卡頓等問題。

智能降噪

SpeechDenoise

純凈人聲在現(xiàn)實生活中會受到各種噪聲干擾,使用智能降噪插件可以將噪聲濾除并保持極高的語音保真度,從而提升語音質(zhì)量和可懂度,為在線會議、在線教育等實時通信場景提供卓越的語音體驗。

聲伴分離

MusicDemix

識別音頻中的人聲和伴奏,快速分離成兩個獨立的音頻文件。適用于卡拉ok的清唱、伴奏提取,任意音頻的背景音提取,滿足音頻素材獲取、后期制作、聲音剪輯等需求。

視頻類處理

智能封面

Cover

封面圖片:選取展現(xiàn)視頻內(nèi)容效果最優(yōu)的圖片,作為視頻的圖片封面。

封面動圖:提取視頻多幀精彩瞬間,拼接生成GIF動圖,作為視頻的動圖封面。

視頻摘要

VideoClip

提取視頻精彩內(nèi)容片段,融合生成最具代表性的5s短視頻摘要。

字幕提取

CaptionExtraction

識別視頻中的字幕,提取文本內(nèi)容及時間信息,輸出為srt字幕文件,支持中英文字幕識別提取,可用于視頻字幕加工場景。

字幕擦除

VideoDetext

采用文字檢測及圖像融合處理技術(shù),智能檢測并去除視頻或圖像中的文字字幕,還原視頻純凈畫面。

圖標模糊

VideoDelogo

識別視頻中的logo圖標位置,并對圖標進行模糊處理,恢復視頻未添加logo的原始狀態(tài),輔助視頻內(nèi)容的后期制作及再生產(chǎn)。

視頻橫轉(zhuǎn)豎

VideoH2V

識別視頻畫面主體,進行比例適應裁剪,將橫屏拍攝的視頻轉(zhuǎn)換成適于移動端豎屏播放的視頻,助力移動時代視頻內(nèi)容二次生產(chǎn)及多端傳播投放。

綠幕摳圖

VideoGreenScreenMatting

綠幕摳圖對視頻圖像的畫面前景背景進行分析提取,檢測純色背景并替換為指定的背景圖,適用于影視制作、短視頻制作及后期編輯場景。

視頻美顏

FaceBeauty

基于智能視覺算法、人臉檢測識別技術(shù),提供視頻文件的人臉美顏功能,支持自動檢測并對人像進行磨皮、美白、紅潤等美顏處理,各項美顏參數(shù)可進行單獨設置,適用于短視頻制作、視頻后期處理等場景。

圖片類處理

圖標模糊

ImageDelogo

識別圖片中的logo圖標位置,并對圖標進行模糊處理,恢復圖片未添加logo的原始態(tài)。

圖片橫轉(zhuǎn)豎

ImageH2V

識別圖片畫面主體,進行比例適應裁剪,將橫屏圖片轉(zhuǎn)換成適于移動端豎屏瀏覽的圖片。

人臉風格化

ImageCartoonize

對圖片中的人臉進行風格化轉(zhuǎn)換,支持二次元、美漫等風格。

智能標簽

分析媒體文件中的視覺、文字、語音、行為等信息,結(jié)合多模態(tài)信息融合及對齊技術(shù),實現(xiàn)高準確率內(nèi)容識別,自動輸出多維度、結(jié)構(gòu)化標簽。應用于視頻搜索、個性化推薦、廣告投放等場景。單擊在線體驗

重要

以下功能需要通過提交智能標簽作業(yè)使用,按成功處理的視頻時長,收取智能標簽費用。計費說明,請參見智能標簽計費

功能

說明

視頻分類

分析視頻內(nèi)容輸出視頻分類類目。

內(nèi)容標簽識別

分析視頻的視覺圖像信息,識別人物、物體、場景、等畫面內(nèi)容標簽。

視頻文字識別標簽OCR

識別視頻圖像中的文字,提取圖像文本內(nèi)容。

視頻語音識別標簽ASR

分析視頻中的語音信息,提取語音文本內(nèi)容。

自定義標簽

支持自定義人臉、地標、Logo、商品等標簽。

智能標簽輸入文件限制如下:

文件參數(shù)

視頻

音頻

圖片

封裝格式

AVI、FLV、MKV、MPG、MP4、TS、MOV、MXF

MP3、WAV

JPG、JPEG、PNG

編碼格式

MPEG2、MPEG-4、H.264/AVC、H.265/HEVC

不涉及

不涉及

文件時長

不超過4小時

不超過4小時

不涉及

文件大小

不超過4 GB

不超過400 MB

不超過4 MB

文件分辨率

240P~2160P,為保證分析效果,建議分辨率不小于720P

不涉及

不超過2160P

智能審核

對媒體文件的標題、簡介、封面、視頻、音頻等內(nèi)容進行審核,有效識別違規(guī)內(nèi)容。應用于短視頻平臺、直播平臺、傳媒審核等場景。單擊立即體驗

重要

以下功能需要通過提交媒體審核作業(yè)使用,按成功處理的視頻時長,收取智能審核費用。計費說明,請參見視頻AI費用

功能

審核內(nèi)容

說明

媒體內(nèi)容審核

涉黃識別

識別語音、文字、畫面中的色情和性感內(nèi)容。

暴恐涉政識別

識別武器、血腥場面、特殊裝束、爆炸煙光、特殊標識、聚眾、游行等十余個維度的暴恐涉政內(nèi)容。

廣告/二維碼識別

識別媒體文件中的文字、水印、二維碼,有效識別牛皮癬廣告、二維碼、小程序碼等多種形式的圖文廣告。

Logo識別

識別視頻圖片中的各種Logo圖標,如臺標、商標、水印等,常用于版權(quán)保護等場景。

不良場景識別

識別畫中畫、吸煙、車內(nèi)直播、無意義畫面等需要監(jiān)管的不良場景。

語音垃圾識別

識別語音中存在的涉黃、暴恐涉政、辱罵等違規(guī)信息,支持中文、英文語音識別。

視頻DNA

基于阿里云視頻指紋技術(shù),通過指紋特征來唯一標記一個視頻/音頻/圖片/文本,提供視頻、圖像、音頻等指紋特征提取、對比功能,可以解決重復視頻查找、視頻片段查源等問題。單擊立即體驗

重要

以下功能需要通過提交DNA作業(yè)使用,按成功處理的音視頻時長,收取視頻DNA費用。計費說明,請參見視頻DNA計費

功能

說明

視頻DNA

提取視頻畫面指紋,支持入庫分析及指紋特征比對,查找?guī)靸?nèi)相似視頻。

音頻DNA

提取音頻指紋,支持入庫分析及指紋特征比對,查找?guī)靸?nèi)相似音頻。

圖片DNA

提取圖片畫面指紋,支持入庫分析及指紋特征比對,查找?guī)靸?nèi)相似圖片。

文本DNA

提取文本內(nèi)容指紋,支持入庫分析及指紋特征比對,查找?guī)靸?nèi)相似文本。

數(shù)字水印(暗水印)

基于阿里云數(shù)字水印技術(shù),支持對視頻進行數(shù)字信息的嵌入、提取。嵌入的水印信息隱藏于載體文件中,水印嵌入后不影響視頻畫面、圖片的視覺質(zhì)量及完整性,可用于版權(quán)保護、泄露溯源、廣播監(jiān)視、信息傳輸、文件驗真等多種場景。詳細說明,請參見數(shù)字水印(暗水印)

重要

以下功能需要通過提交視頻版權(quán)水印/溯源水印作業(yè)使用,按成功處理的音視頻時長,收取數(shù)字水印費用。計費說明,請參見數(shù)字水印計費

功能

說明

相關(guān)API

控制臺操作

視頻版權(quán)水印

為視頻(僅支持3分鐘及以上的視頻 )嵌入不可見的指定文字信息,嵌入的數(shù)字水印隱藏于媒體文件中,不影響視頻的視覺質(zhì)量及完整性。當視頻被傳播、加工后,依然可以提取識別嵌入的文字信息。

提交視頻版權(quán)水印提交版權(quán)水印提取作業(yè)

不支持

視頻溯源水印

為視頻(僅支持3分鐘及以上的視頻)轉(zhuǎn)碼輸出A流和B流兩個HLS文件,兩路流被嵌入的溯源水印內(nèi)容不同。用戶請求播放時,隨機選擇AB流的分片及逆行組合,實時生成與用戶身份唯一對應的溯源水印M3U8文件。當發(fā)生視頻盜版時,只要檢測其中的水印信息就可以追蹤到泄露視頻的用戶,盜版權(quán)責追溯。

提交視頻溯源水印ab流提交視頻溯源水印m3u8提交溯源水印提取作業(yè)

不支持

服務管理

類別

說明

API相關(guān)參數(shù)

控制臺操作

媒體管理

媒體視頻文件上傳、管理與發(fā)布。

不涉及

不涉及

工作流編排

云端自動化處理工作流,音視頻上傳完畢后自動執(zhí)行處理流程。

不涉及

支持

轉(zhuǎn)碼模板

轉(zhuǎn)碼模板是一系列轉(zhuǎn)碼參數(shù)的集合,在創(chuàng)建轉(zhuǎn)碼任務或使用工作流時,可以使用轉(zhuǎn)碼模板簡化操作。按創(chuàng)建來源分為自定義模板、定制模板、系統(tǒng)預置模板。

TemplateId

支持

水印模板

水印模板是一系列包含水印位置、大小的參數(shù),使用水印模板,可以幫助您簡化開發(fā)操作。

WaterMarkTemplateId

支持

轉(zhuǎn)碼優(yōu)先級

設置任務在管道內(nèi)的轉(zhuǎn)碼優(yōu)先級,最多分為10級。

Priority

不支持

條件轉(zhuǎn)碼

對比原視頻的視頻碼率、視頻分辨率、音頻碼率是否小于指定輸出設置,如果小于則按原畫或不轉(zhuǎn)碼。

IsCheckReso、IsCheckResoFail等

支持

管道隊列

媒體處理轉(zhuǎn)碼、異步截圖等作業(yè)為異步處理,需要加入管道中被調(diào)度執(zhí)行。支持創(chuàng)建多個任務管道,并設置任務在管道內(nèi)的轉(zhuǎn)碼優(yōu)先級,最多分為10級。

Priority

不支持

消息通知

媒體處理轉(zhuǎn)碼、異步截圖等作業(yè)為異步處理。通過集成MNS服務,為管道或工作流綁定主題或隊列通知,當任務完成、工作流開始和結(jié)束時會通過MNS主動推送給用戶。

NotifyConfig

支持

數(shù)據(jù)統(tǒng)計

查詢指定時間段使用的轉(zhuǎn)碼、截圖、視頻審核、視頻DNA的用量時長。

不涉及

不涉及