日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

智能生產接口參數補充說明

本文介紹提交智能生產作業請求參數JobParamsOutput及查詢智能生產作業返回參數Job補充說明。

字幕提取:CaptionExtraction

名稱

類型

描述

Output

String

如果JobParams設置了中英文分離,輸出文件路徑中支持{resultType}占位符,用來比較對應字幕結果文件是中文或英文,中文為zh,英文為en。

JobParams參數說明:

名稱

類型

是否必填

描述

fps

Int

采樣幀率(可選),整數,取值范圍為[2,10],默認5

roi

List

字幕框選區域。

  • 如果輸入框選區域,則只對區域內的字幕進行提取,區域外的文字忽略。如果不填該參數,默認識別視頻底部1/4區域。

  • 格式:[[top, bottom], [left, right]]。

  • 默認:

sep

Boolean

是否中英文分離輸出兩個srt文件,可選,默認False

formatter

String

srt的字幕格式字符串(可選),例如:"{\an8}",默認

回調格式

JSON格式

{
  "Code":"Success",
  "Details":[],"FunctionName":"CaptionExtraction",
  "JobId":"39f8e0bc005e4f309379701645f4****",
  "Message":"success","State":"Succes"
}

Job參數說明:

名稱

類型

描述

Result

String

作業結果詳細信息,成功結果信息如:{"Code":"Success","Message":"Successful.","Data":"{\"result\":[{\"file\":\"captionextraction/b48d02b58e9b6a0d1c13271bcf9aa6d7-161121379****.srt\"}]}"}

綠幕摳圖:VideoGreenScreenMatting

JobParams參數說明:

名稱

類型

是否必填

描述

bgimage

String

替換的背景圖片,例如:http://example-image-****.example-location.aliyuncs.com/example/example.jpg。

  • 傳入該參數:輸出替換背景后的MP4視頻。

  • 不傳該參數:輸出帶透明通道的WEBM視頻。

回調格式

JSON格式

{
  "Code":"Success",
  "Details":[],"FunctionName":"VideoGreenScreenMatting",
  "JobId":"39f8e0bc005e4f309379701645f4****",
  "Message":"success",
  "State":"Success",
  "Type":"IProduction"
}

Job參數說明:

名稱

類型

描述

Result

String

作業結果詳細信息,成功結果信息。示例如下:{"Code":"Success","Message":"Successful.","Data":"{\"result\":[{\"file\":\"videogreenscreenmatting/16e6bc5ca802e12429d082010164dba3-160275535****_matting.mp4\"}]}"}

副歌檢測:MusicSegmentDetect

JobParams參數說明:

名稱

類型

是否必填

描述

回調格式

JSON格式

{
  "Code":"Success",
  "Details":[],
  "FunctionName":"MusicSegmentDetect",
  "JobId":"39f8e0bc005e4f309379701645f4****",
  "Message":"success",
  "State":"Success",
  "Type":"IProduction"
}

Job參數說明:

名稱

類型

描述

Result

String

作業結果詳細信息,成功結果信息。示例如下:{"Code":"Success","Data":"{\"result\":[{\"start\":39.32,\"end\":63.85,\"title\":\"副歌\"},{\"start\":86.69,\"end\":114.45,\"title\":\"副歌\"},{\"start\":135.75,\"end\":160.27,\"title\":\"副歌\"}]}","Message":"Successful."}

視頻去字幕:VideoDetext

JobParams參數說明:

名稱

類型

是否必填

描述

Text

List

目標字幕框位置。目前最多支持兩個目標字幕。例如:[[bx1, by1, bw1, bh1], [bx2, by2, bw2, bh2]]。

說明

一個字幕框中須同時包含bx、by、bw、bh。

  • bx:字幕框距離左上角的歸一化x軸坐標相對于視頻寬度比例,例如0.1。

  • by:字幕框距離左上角的歸一化y軸坐標相對于視頻高度比例,例如0.0。

  • bw:歸一化寬度相對視頻寬度比例,例如0.3。

  • bh:歸一化高度相對視頻高度比例,例如0.2。

LimitRegion

List

指定擦除限制范圍,在限制區域內檢測之后擦除字幕區域。優先級低于直接指定擦除區域Text。示例:LimitRegion: [[0, 0.6, 1, 0.4]]為在圖像下方40%區域進行字幕檢測與擦除。

回調格式

JSON格式

{
  "Code":"Success",
  "Details":[], 
  "FunctionName":"VideoDetext",
  "JobId":"39f8e0bc005e4f309379701645f4****",
  "Message":"success",
  "State":"Success",
  "Type":"IProduction"
}

Job參數說明:

名稱

類型

描述

Result

String

作業結果詳細信息,成功結果信息。示例如下:{"Details":[],"Message":"success","Code":"Success"}

視頻橫轉豎:VideoH2V

JobParams參數說明:

名稱

類型

是否必填

描述

回調格式

JSON格式

{
  "Code":"Success",
  "Details":[],
  "FunctionName":"VideoH2V",
  "JobId":"39f8e0bc005e4f309379701645f4****",
  "Message":"success",
  "State":"Success",
  "Type":"IProduction"
}

Job參數說明:

名稱

類型

描述

Result

String

作業結果詳細信息,成功結果信息。示例如下:{"Details":[],"Message":"success","Code":"Success"}

視頻去圖標:VideoDelogo

JobParams參數說明:

名稱

類型

是否必填

描述

Logo

String

目標logo框位置,[xmin, ymin, width, height],目前最多支持兩個目標logo框,例如:[[0, 0, 0.3, 0.3], [0.7, 0, 0.3, 0.3]]

回調格式

JSON格式

{
  "Code":"Success",
  "Details":[],
  "FunctionName":"VideoDelogo",
  "JobId":"39f8e0bc005e4f309379701645f4****",
  "Message":"success",
  "State":"Success",
  "Type":"IProduction"
}

Job參數說明:

名稱

類型

描述

Result

String

作業結果詳細信息,成功結果信息。示例如下:{"Details":[],"Message":"success","Code":"Success"}

智能封面:Cover

JobParams參數說明:

名稱

類型

是否必填

描述

Model

String

智能封面模型,為空時輸出圖片封面,為gif時輸出動圖封面。

回調格式

JSON格式

{
  "Code":"Success",
  "Details":[],
  "FunctionName":"Cover",
  "JobId":"39f8e0bc005e4f309379701645f4****",
  "Message":"success",
  "State":"Success",
  "Type":"IProduction"
}

Job參數說明:

名稱

類型

描述

Result

String

作業結果詳細信息,成功結果信息。示例如下:{"Details":[],"Message":"success","Code":"Success"}{"Message":"success","Data":"[{\"Score\":8.270855992569906,\"Time\":\"28278.25\",\"Url\":\"cover/test-00001.jpg\"},{\"Score\":7.474117489692728,\"Time\":\"25942.583333333332\",\"Url\":\"cover/test-00002.jpg\"}]","Code":"Success"},其中Score為封面結果置信度,Time為封面幀時間戳,Url為封面文件路徑。

視頻摘要:VideoClip

JobParams參數說明:

名稱

類型

是否必填

描述

回調格式

JSON格式

{
  "Code":"Success",
  "Details":[],
  "FunctionName":"VideoClip",
  "JobId":"39f8e0bc005e4f309379701645f4****",
  "Message":"success",
  "State":"Success",
  "Type":"IProduction"
}

Job參數說明:

名稱

類型

描述

Result

String

作業結果詳細信息,成功結果信息。示例如下:

{"Code":"Success","Message":"Successful.","Data":"{\"result\":[{\"file\":\"videoclip/16e6bc5ca802e12429d082010164****-1602755353502-origin.mp4\"}]}"}

圖片橫轉豎:ImageH2V

JobParams參數說明:

名稱

類型

是否必填

描述

回調格式

JSON格式

{
  "Code":"Success",
  "Details":[],
  "FunctionName":"ImageH2V",
  "JobId":"39f8e0bc005e4f309379701645f4****",
  "Message":"success",
  "State":"Success",
  "Type":"IProduction"
}

Job參數說明:

名稱

類型

描述

Result

String

作業結果詳細信息,成功結果信息。示例如下:{"Details":[],"Message":"success","Code":"Success"}

圖片去圖標:ImageDelogo

JobParams參數說明:

名稱

類型

是否必填

描述

回調格式

JSON格式

{
  "Code":"Success",
  "Details":[],
  "FunctionName":"ImageDelogo",
  "JobId":"39f8e0bc005e4f309379701645f4****",
  "Message":"success",
  "State":"Success",
  "Type":"IProduction"
}

Job參數說明:

名稱

類型

描述

Result

String

作業結果詳細信息,成功結果信息。示例如下:{"Details":[],"Message":"success","Code":"Success"}

節奏檢測:AudioBeatDetection

JobParams參數說明:

名稱

類型

是否必填

描述

回調格式

JSON格式

{
  "Code":"Success",
  "Details":[],
  "FunctionName":"AudioBeatDetection",
  "JobId":"39f8e0bc005e4f309379701645f4****",
  "Message":"success",
  "State":"Success",
  "Type":"IProduction"
}

Job參數說明:

名稱

類型

描述

Result

String

作業結果詳細信息,成功結果信息如:{"Code":"Success","Data":"{\"result\":[{\"file\":\"detectresult/normalvideo-161225931****.txt\"}]}","Message":"Successful."}

混音處理:AudioMixing

JobParams參數說明:

名稱

類型

是否必填

描述

inputs

String

待混合的音軌文件地址列表,目前只支持一個,例如:{"file":"http://example-bucket-****.oss-cn-shanghai.aliyuncs.com/2.mp4"}

回調格式

JSON格式

{
  "Code":"Success",
  "FunctionName":"AudioMixing",
  "JobId":"158688059d8443a68b78a65e55b3****",
  "Message":"Successful.",
  "State":"Success",
  "Type":"IProduction",
  "UserData":"test"
}

Job參數說明:

名稱

類型

描述

Result

String

作業結果詳細信息,成功結果信息如:{"Message":"Successful.","Data":"{\"result\":[{\"file\":\"audiomix/alibaba-161283935****-origin.mp4\"}]}","Code":"Success"}

3D風格、人臉風格化:ImageCartoonize

Output參數說明:

名稱

類型

描述

Output

String

路徑中支持{resultType}占位符,用來區分結果文件是卡通化結果圖/原圖,卡通化結果為result,原圖為origin。

回調示例

JSON格式

{
 "Code":"Success",
 "Details":[],
 "FunctionName":"ImageCartoonize",
 "JobId":"39f8e0bc005e4f309379701645f4744c",
 "Message":"success",
 "State":"Success",
 "Type":"IProduction"
}

Job參數說明:

名稱

類型

描述

Result

String

作業結果詳細信息,成功結果信息如:{"Code":"Success","Data":"{\"result\":[{\"file\":\"iproduction/test-result.jpg\"},{\"file\":\"iproduction/test-origin.jpg\"}]}","Message":"Successful."}

音質檢測:AudioQualityAssessment

Job參數說明:

名稱

類型

描述

Result

String

作業結果詳細信息,成功結果信息如下。

Result結果信息:

{
  "Code" : "Success",
  "Data" : "{
    \"result\":[{
        \"Discontinuity\":\"Good\",
        \"Loudness\":\"Excellent\",
        \"Worst MOS(0-5)\":\"0.38\",
        \"Discontinuity(0-5)\":\"3.52\",
        \"Speech Ratio\":\"48.55\",
        \"Loudness(0-5)\":\"4.91\",
        \"Worst Discontinuity(0-5)\":\"0.88\",
        \"Worst Coloration(0-5)\":\"0.42\",
        \"Channel\":\"1\",
        \"Coloration(0-5)\":\"0.99\",
        \"Bad Mute Ratio(%)\":\"0.0\",
        \"Time\":\"2022-12-02 16:14:06\",
        \"Noisiness(0-5)\":\"3.28\",
        \"MOS\":\"Poor\",
        \"Worst Noisiness(0-5)\":\"0.91\",
        \"Double Talk Ratio(%)\":\"19.23\",
        \"Input\":\"/home/admin/algo/quality****/example.wav\",
        \"Total Duration\":\"42.78\",
        \"Noisiness\":\"Good\",
        \"Tag\":\"Valid\",
        \"MOS(0-5)\":\"1.01\",
        \"Loudness(-90dB-0dB)\":\"-0.59\",
        \"Coloration\":\"Bad\",
        \"Saturated Ratio(%)\":\"37.55\"
    },
    {
        \"Discontinuity\":\"Fair\",
        \"Loudness\":\"Excellent\",
        \"Worst MOS(0-5)\":\"0.65\",
        \"Discontinuity(0-5)\":\"2.45\",
        \"Speech Ratio\":\"41.68\",
        \"Loudness(0-5)\":\"4.52\",
        \"Worst Discontinuity(0-5)\":\"0.66\",
        \"Worst Coloration(0-5)\":\"0.72\",
        \"Channel\":\"2\",
        \"Coloration(0-5)\":\"2.34\",
        \"Bad Mute Ratio(%)\":\"0.0\",
        \"Time\":\"2022-12-02 16:14:06\",
        \"Noisiness(0-5)\":\"2.53\",
        \"MOS\":\"Poor\",
        \"Worst Noisiness(0-5)\":\"0.67\",
        \"Double Talk Ratio(%)\":\"25.93\",
        \"Input\":\"/home/admin/algo/quality****/example.wav\",
        \"Total Duration\":\"42.78\",
        \"Noisiness\":\"Fair\",
        \"Tag\":\"Valid\",
        \"MOS(0-5)\":\"1.69\",
        \"Loudness(-90dB-0dB)\":\"-4.82\",
        \"Coloration\":\"Fair\",
        \"Saturated Ratio(%)\":\"0.0\"
    }]
  }",
  "Message" : "Successful."
}

參數說明

參數

說明

Time

時間戳,對輸入文件執行打分的時刻。

Input

輸入文件名。

Total Duration

文件時長,單位為秒。

Speech Ratio

語音時長占比,取值范圍為[0,100],單位為百分比(%)。

Tag

標簽,用于說明檢測的有效性。

  • Valid : 檢測有效,即后續關鍵指標和MOS都是有效的。

  • File too Short:輸入文件時長小于2s。

  • Mute:全程完全靜音。

  • Voice too Short:話音時長小于2s

說明
  • 四個事件互斥。

  • 后三種情況的MOS,Discontinuity,Coloration,Noisiness無意義,數值上會給出0。

MOS(0-5)

文件平均MOS,描述語音部分的質量,取值范圍[0,5]。

MOS

分值描述。取值如下:

  • (4, 5]:Excellent

  • [3, 4):Good

  • [2, 3):Fair

  • [1, 2):Poor

  • [0, 1):Bad

Discontinuity(0-5)

語音連續性,當發生采集卡頓、雙講抑制、網絡丟包時,連續性分值會下降。取值范圍[0,5]。

Discontinuity

分值描述。取值如下:

  • (4, 5]:Excellent

  • [3, 4):Good

  • [2, 3):Fair

  • [1, 2):Poor

  • [0, 1):Bad

Coloration(0-5)

語音清晰度、可懂度,如環境混響較大,碼率較低(或編碼錯誤)、發音含糊不清時,語音自然度分值降低。取值范圍[0,5]。

Coloration

分值描述。取值如下:

  • (4, 5]:Excellent

  • [3, 4):Good

  • [2, 3):Fair

  • [1, 2):Poor

  • [0, 1):Bad

Noisiness(0-5)

噪音嚴重程度,取值范圍[0,5]。

說明

噪音的幾個來源:環境噪聲(如風扇,街道),某些較差設備的底噪,以及拾音設備回聲處理不干凈所殘留的雜音等等,這些噪音如果沒有良好的降噪處理,會使噪音問題較突出。

Noisiness

分值描述。取值如下:

  • (4, 5]:Excellent

  • [3, 4):Good

  • [2, 3):Fair

  • [1, 2):Poor

  • [0, 1):Bad

Loudness(0-5)

人聲響度,即人聲音量的大小,聲音清晰洪亮分支偏高,聲音很小幾乎聽不到,則分值趨近于0。取值范圍[0,5]。

Loudness

分值描述。取值如下:

  • (4, 5]:Excellent

  • [3, 4):Good

  • [2, 3):Fair

  • [1, 2):Poor

  • [0, 1):Bad

Loudness(-90dB-0dB)

平均語音音量。取值范圍[-90,0],單位為分貝(dB)。

  • 從分貝角度描述了人聲音量的大小,一般小于-24dB時,聽感上人聲會偏小。

  • 默認值:-90.0,表示未檢測到明確的語音成分。

Double Talk Ratio(%)

雙講占比,用于輔助判斷連續性Discontinuity分值較低時的可能因素。取值范圍[0,100],單位為百分比(%)。

說明

此處雙講統計的是雙端都有聲音,而不是嚴格的話音,例如設備漏殘留回聲時,可能會被計為“雙講”,但因為這個情況也會使Discontinuity變差,所以仍有助于輔助判斷。

Bad Mute Ratio(%)

異常靜音幀占比,對雙講時段之外的話音進行異常靜音統計(排除雙講剪切所致的靜音幀)。取值范圍[0,100],單位為百分比(%)。

Saturated Ratio(%)

語音段中出現爆音占有話段的比例,用于輔助判斷采集音量過大導致的大范圍爆音問題。取值范圍[0,100],單位為百分比(%)。

Worst MOS(0-5)

打分過程中的最低MOS,取值范圍[0,5]。

Worst Discontinuity(0-5)

打分過程中最嚴重的斷續程度,取值范圍[0,5]。

Worst Noisiness(0-5)

打分過程中噪聲最大的程度,取值范圍[0,5]。

Worst Coloration(0-5)

打分過程中最差的語音自然度,取值范圍[0,5]。

美顏:FaceBeauty

Job參數說明:

名稱

類型

是否必填

描述

beauty_params

String

美顏功能參數,填寫示例: "whiten=20,smooth=50,face_thin=50"

回調示例

JSON格式

{
	"Code":"Success",
  "Details":[],
  "FunctionName":"FaceBeauty",
  "JobId":"39f8e0bc005e4f309379701645f4****",
  "Message":"success",
  "State":"Success",
  "Type":"IProduction"
 }

參數說明

參數

類型

說明

skin_beauty_enable

int

美膚開關。

  • 取值范圍:[0,1]

  • 0:關閉

  • 1:開啟

  • 默認值:1

shape_beauty_enable

int

美型開關。

  • 取值范圍:[0,1]

  • 0:關閉

  • 1:開啟

  • 默認值:1

whiten

int

美白的力度,值越大,膚色區域將會越白。

  • 取值范圍:[0,100]

  • 默認值:20

smooth

int

平滑的力度,值越大,膚色區域越模糊。

  • 取值范圍:[0,100]

  • 默認值:20

detail

int

膚色細節的顆粒度,值越大,真實膚色的顆粒感越重,細節越多。

  • 取值范圍:[0,100]

  • 默認值:20

skin_model

int

開啟時,美白只會作用在檢測為皮膚的區域。

  • 取值范圍:[0,1]

  • 0:關閉

  • 1:開啟

  • 默認值:1

cheek_thin

float

瘦額骨。

  • 取值范圍:[0,100]

  • 默認值:0

face_cut

float

削臉。

  • 取值范圍:[0,100]

  • 默認值:0

face_thin

float

瘦臉。

  • 取值范圍:[0,100]

  • 默認值:0

face_length

float

臉長調節(雙向)。

  • 取值范圍:[-100,100]

  • 默認值:0

chin_length

float

下巴長度調節(雙向)。

  • 取值范圍:[-100,100]

  • 默認值:0

chin_thin

float

瘦下巴。

  • 取值范圍:[0,100]

  • 默認值:0

eye_size

float

眼睛變大。

  • 取值范圍:[0,100]

  • 默認值:0

eye_corner1

float

豎直方向調節眼角(雙向)。

  • 取值范圍:[-100,100]

  • 默認值:0

eye_distance

float

調節眼距(雙向)。

  • 取值范圍:[-100,100]

  • 默認值:0

nose_thin

float

瘦鼻子(雙向)。

  • 取值范圍:[-100,100]

  • 默認值:0

nose_wing

float

瘦鼻翼(雙向)。

  • 取值范圍:[-100,100]

  • 默認值:0

nose_length

float

鼻長調節(雙向)。

  • 取值范圍:[-100,100]

  • 默認值:0

mouth_size

float

嘴巴大小調節(雙向)。

  • 取值范圍:[-100,100]

  • 默認值:0

mouth_position

float

人中長度調節(雙向)。

  • 取值范圍:[-100,100]

  • 默認值:0

lip_thickness

float

嘴唇厚度調節(雙向)。

  • 取值范圍:[-100,100]

  • 默認值:0

hair_line

float

發際線調節(雙向)。

  • 取值范圍:[-100,100]

  • 默認值:0

smile

float

微笑。

  • 取值范圍:[0,100]

  • 默認值:0

detect_mode

float

人臉檢測模式。

  • 取值范圍:[0,1]

  • 0:視頻模式

  • 1:圖像模式

  • 默認值:1

說明

視頻模式會使用多幀信息來追蹤人臉,使結果更加穩定。

detect_level

float

人臉檢測器的分辨率。低分辨率下,比較小的人臉可能會漏。

  • 取值范圍:[0,2]

  • 0:最低分辨率,速度最快

  • 1:中等分辨率,速度中等

  • 2:最高分辨率,速度最慢

  • 默認值:1

threshold

float

人臉檢測置信度閾值。

  • 取值范圍:[0,1]

  • 默認值:0.8

detect_interval

float

視頻模式下的人臉檢測間隔幀數。

  • 取值范圍:[1,65535]

  • 默認值:5

max_face_num

float

最大支持的人臉個數。

  • 取值范圍:[0,32]

  • 默認值:32

min_face

float

最小人臉的寬度。

  • 取值范圍:[10,1024]

  • 默認值:40

Job參數說明

名稱

類型

描述

Result

String

作業結果詳細信息,成功結果信息如:{"Code":"Success","Data":"{\"result\":[{\"file\":\"result.mp4\"}]}","Message":"Successful."}

智能降噪:SpeechDenoise

輸入音頻文件,輸入音頻的格式需為WAV,采樣率為16khz或48khz。

輸出處理后的音頻文件,采樣率及格式同輸入文件一致。