本文介紹提交智能生產作業請求參數JobParams、Output及查詢智能生產作業返回參數Job補充說明。
字幕提取:CaptionExtraction
名稱 | 類型 | 描述 |
Output | String | 如果JobParams設置了中英文分離,輸出文件路徑中支持 |
JobParams參數說明:
名稱 | 類型 | 是否必填 | 描述 |
fps | Int | 否 | 采樣幀率(可選),整數,取值范圍為[2,10],默認5。 |
roi | List | 否 | 字幕框選區域。
|
sep | Boolean | 否 | 是否中英文分離輸出兩個srt文件,可選,默認False。 |
formatter | String | 否 | srt的字幕格式字符串(可選),例如:"{\an8}",默認無。 |
回調格式
JSON格式
{
"Code":"Success",
"Details":[],"FunctionName":"CaptionExtraction",
"JobId":"39f8e0bc005e4f309379701645f4****",
"Message":"success","State":"Succes"
}
Job參數說明:
名稱 | 類型 | 描述 |
Result | String | 作業結果詳細信息,成功結果信息如: |
綠幕摳圖:VideoGreenScreenMatting
JobParams參數說明:
名稱 | 類型 | 是否必填 | 描述 |
bgimage | String | 否 | 替換的背景圖片,例如:http://example-image-****.example-location.aliyuncs.com/example/example.jpg。
|
回調格式
JSON格式
{
"Code":"Success",
"Details":[],"FunctionName":"VideoGreenScreenMatting",
"JobId":"39f8e0bc005e4f309379701645f4****",
"Message":"success",
"State":"Success",
"Type":"IProduction"
}
Job參數說明:
名稱 | 類型 | 描述 |
Result | String | 作業結果詳細信息,成功結果信息。示例如下: |
副歌檢測:MusicSegmentDetect
JobParams參數說明:
名稱 | 類型 | 是否必填 | 描述 |
無 | 無 | 無 | 無 |
回調格式
JSON格式
{
"Code":"Success",
"Details":[],
"FunctionName":"MusicSegmentDetect",
"JobId":"39f8e0bc005e4f309379701645f4****",
"Message":"success",
"State":"Success",
"Type":"IProduction"
}
Job參數說明:
名稱 | 類型 | 描述 |
Result | String | 作業結果詳細信息,成功結果信息。示例如下: |
視頻去字幕:VideoDetext
JobParams參數說明:
名稱 | 類型 | 是否必填 | 描述 |
Text | List | 否 | 目標字幕框位置。目前最多支持兩個目標字幕。例如:[[bx1, by1, bw1, bh1], [bx2, by2, bw2, bh2]]。 說明 一個字幕框中須同時包含bx、by、bw、bh。
|
LimitRegion | List | 否 | 指定擦除限制范圍,在限制區域內檢測之后擦除字幕區域。優先級低于直接指定擦除區域Text。示例: |
回調格式
JSON格式
{
"Code":"Success",
"Details":[],
"FunctionName":"VideoDetext",
"JobId":"39f8e0bc005e4f309379701645f4****",
"Message":"success",
"State":"Success",
"Type":"IProduction"
}
Job參數說明:
名稱 | 類型 | 描述 |
Result | String | 作業結果詳細信息,成功結果信息。示例如下: |
視頻橫轉豎:VideoH2V
JobParams參數說明:
名稱 | 類型 | 是否必填 | 描述 |
無 | 無 | 無 | 無 |
回調格式
JSON格式
{
"Code":"Success",
"Details":[],
"FunctionName":"VideoH2V",
"JobId":"39f8e0bc005e4f309379701645f4****",
"Message":"success",
"State":"Success",
"Type":"IProduction"
}
Job參數說明:
名稱 | 類型 | 描述 |
Result | String | 作業結果詳細信息,成功結果信息。示例如下: |
視頻去圖標:VideoDelogo
JobParams參數說明:
名稱 | 類型 | 是否必填 | 描述 |
Logo | String | 否 | 目標logo框位置,[xmin, ymin, width, height],目前最多支持兩個目標logo框,例如:[[0, 0, 0.3, 0.3], [0.7, 0, 0.3, 0.3]] |
回調格式
JSON格式
{
"Code":"Success",
"Details":[],
"FunctionName":"VideoDelogo",
"JobId":"39f8e0bc005e4f309379701645f4****",
"Message":"success",
"State":"Success",
"Type":"IProduction"
}
Job參數說明:
名稱 | 類型 | 描述 |
Result | String | 作業結果詳細信息,成功結果信息。示例如下: |
智能封面:Cover
JobParams參數說明:
名稱 | 類型 | 是否必填 | 描述 |
Model | String | 否 | 智能封面模型,為空時輸出圖片封面,為gif時輸出動圖封面。 |
回調格式
JSON格式
{
"Code":"Success",
"Details":[],
"FunctionName":"Cover",
"JobId":"39f8e0bc005e4f309379701645f4****",
"Message":"success",
"State":"Success",
"Type":"IProduction"
}
Job參數說明:
名稱 | 類型 | 描述 |
Result | String | 作業結果詳細信息,成功結果信息。示例如下: |
視頻摘要:VideoClip
JobParams參數說明:
名稱 | 類型 | 是否必填 | 描述 |
無 | 無 | 無 | 無 |
回調格式
JSON格式
{
"Code":"Success",
"Details":[],
"FunctionName":"VideoClip",
"JobId":"39f8e0bc005e4f309379701645f4****",
"Message":"success",
"State":"Success",
"Type":"IProduction"
}
Job參數說明:
名稱 | 類型 | 描述 |
Result | String | 作業結果詳細信息,成功結果信息。示例如下:
|
圖片橫轉豎:ImageH2V
JobParams參數說明:
名稱 | 類型 | 是否必填 | 描述 |
無 | 無 | 無 | 無 |
回調格式
JSON格式
{
"Code":"Success",
"Details":[],
"FunctionName":"ImageH2V",
"JobId":"39f8e0bc005e4f309379701645f4****",
"Message":"success",
"State":"Success",
"Type":"IProduction"
}
Job參數說明:
名稱 | 類型 | 描述 |
Result | String | 作業結果詳細信息,成功結果信息。示例如下: |
圖片去圖標:ImageDelogo
JobParams參數說明:
名稱 | 類型 | 是否必填 | 描述 |
無 | 無 | 無 | 無 |
回調格式
JSON格式
{
"Code":"Success",
"Details":[],
"FunctionName":"ImageDelogo",
"JobId":"39f8e0bc005e4f309379701645f4****",
"Message":"success",
"State":"Success",
"Type":"IProduction"
}
Job參數說明:
名稱 | 類型 | 描述 |
Result | String | 作業結果詳細信息,成功結果信息。示例如下: |
節奏檢測:AudioBeatDetection
JobParams參數說明:
名稱 | 類型 | 是否必填 | 描述 |
無 | 無 | 無 | 無 |
回調格式
JSON格式
{
"Code":"Success",
"Details":[],
"FunctionName":"AudioBeatDetection",
"JobId":"39f8e0bc005e4f309379701645f4****",
"Message":"success",
"State":"Success",
"Type":"IProduction"
}
Job參數說明:
名稱 | 類型 | 描述 |
Result | String | 作業結果詳細信息,成功結果信息如: |
混音處理:AudioMixing
JobParams參數說明:
名稱 | 類型 | 是否必填 | 描述 |
inputs | String | 否 | 待混合的音軌文件地址列表,目前只支持一個,例如: |
回調格式
JSON格式
{
"Code":"Success",
"FunctionName":"AudioMixing",
"JobId":"158688059d8443a68b78a65e55b3****",
"Message":"Successful.",
"State":"Success",
"Type":"IProduction",
"UserData":"test"
}
Job參數說明:
名稱 | 類型 | 描述 |
Result | String | 作業結果詳細信息,成功結果信息如: |
3D風格、人臉風格化:ImageCartoonize
Output參數說明:
名稱 | 類型 | 描述 |
Output | String | 路徑中支持 |
回調示例
JSON格式
{
"Code":"Success",
"Details":[],
"FunctionName":"ImageCartoonize",
"JobId":"39f8e0bc005e4f309379701645f4744c",
"Message":"success",
"State":"Success",
"Type":"IProduction"
}
Job參數說明:
名稱 | 類型 | 描述 |
Result | String | 作業結果詳細信息,成功結果信息如: |
音質檢測:AudioQualityAssessment
Job參數說明:
名稱 | 類型 | 描述 |
Result | String | 作業結果詳細信息,成功結果信息如下。 |
Result結果信息:
{
"Code" : "Success",
"Data" : "{
\"result\":[{
\"Discontinuity\":\"Good\",
\"Loudness\":\"Excellent\",
\"Worst MOS(0-5)\":\"0.38\",
\"Discontinuity(0-5)\":\"3.52\",
\"Speech Ratio\":\"48.55\",
\"Loudness(0-5)\":\"4.91\",
\"Worst Discontinuity(0-5)\":\"0.88\",
\"Worst Coloration(0-5)\":\"0.42\",
\"Channel\":\"1\",
\"Coloration(0-5)\":\"0.99\",
\"Bad Mute Ratio(%)\":\"0.0\",
\"Time\":\"2022-12-02 16:14:06\",
\"Noisiness(0-5)\":\"3.28\",
\"MOS\":\"Poor\",
\"Worst Noisiness(0-5)\":\"0.91\",
\"Double Talk Ratio(%)\":\"19.23\",
\"Input\":\"/home/admin/algo/quality****/example.wav\",
\"Total Duration\":\"42.78\",
\"Noisiness\":\"Good\",
\"Tag\":\"Valid\",
\"MOS(0-5)\":\"1.01\",
\"Loudness(-90dB-0dB)\":\"-0.59\",
\"Coloration\":\"Bad\",
\"Saturated Ratio(%)\":\"37.55\"
},
{
\"Discontinuity\":\"Fair\",
\"Loudness\":\"Excellent\",
\"Worst MOS(0-5)\":\"0.65\",
\"Discontinuity(0-5)\":\"2.45\",
\"Speech Ratio\":\"41.68\",
\"Loudness(0-5)\":\"4.52\",
\"Worst Discontinuity(0-5)\":\"0.66\",
\"Worst Coloration(0-5)\":\"0.72\",
\"Channel\":\"2\",
\"Coloration(0-5)\":\"2.34\",
\"Bad Mute Ratio(%)\":\"0.0\",
\"Time\":\"2022-12-02 16:14:06\",
\"Noisiness(0-5)\":\"2.53\",
\"MOS\":\"Poor\",
\"Worst Noisiness(0-5)\":\"0.67\",
\"Double Talk Ratio(%)\":\"25.93\",
\"Input\":\"/home/admin/algo/quality****/example.wav\",
\"Total Duration\":\"42.78\",
\"Noisiness\":\"Fair\",
\"Tag\":\"Valid\",
\"MOS(0-5)\":\"1.69\",
\"Loudness(-90dB-0dB)\":\"-4.82\",
\"Coloration\":\"Fair\",
\"Saturated Ratio(%)\":\"0.0\"
}]
}",
"Message" : "Successful."
}
參數說明
參數 | 說明 |
Time | 時間戳,對輸入文件執行打分的時刻。 |
Input | 輸入文件名。 |
Total Duration | 文件時長,單位為秒。 |
Speech Ratio | 語音時長占比,取值范圍為[0,100],單位為百分比(%)。 |
Tag | 標簽,用于說明檢測的有效性。
說明
|
MOS(0-5) | 文件平均MOS,描述語音部分的質量,取值范圍[0,5]。 |
MOS | 分值描述。取值如下:
|
Discontinuity(0-5) | 語音連續性,當發生采集卡頓、雙講抑制、網絡丟包時,連續性分值會下降。取值范圍[0,5]。 |
Discontinuity | 分值描述。取值如下:
|
Coloration(0-5) | 語音清晰度、可懂度,如環境混響較大,碼率較低(或編碼錯誤)、發音含糊不清時,語音自然度分值降低。取值范圍[0,5]。 |
Coloration | 分值描述。取值如下:
|
Noisiness(0-5) | 噪音嚴重程度,取值范圍[0,5]。 說明 噪音的幾個來源:環境噪聲(如風扇,街道),某些較差設備的底噪,以及拾音設備回聲處理不干凈所殘留的雜音等等,這些噪音如果沒有良好的降噪處理,會使噪音問題較突出。 |
Noisiness | 分值描述。取值如下:
|
Loudness(0-5) | 人聲響度,即人聲音量的大小,聲音清晰洪亮分支偏高,聲音很小幾乎聽不到,則分值趨近于0。取值范圍[0,5]。 |
Loudness | 分值描述。取值如下:
|
Loudness(-90dB-0dB) | 平均語音音量。取值范圍[-90,0],單位為分貝(dB)。
|
Double Talk Ratio(%) | 雙講占比,用于輔助判斷連續性Discontinuity分值較低時的可能因素。取值范圍[0,100],單位為百分比(%)。 說明 此處雙講統計的是雙端都有聲音,而不是嚴格的話音,例如設備漏殘留回聲時,可能會被計為“雙講”,但因為這個情況也會使Discontinuity變差,所以仍有助于輔助判斷。 |
Bad Mute Ratio(%) | 異常靜音幀占比,對雙講時段之外的話音進行異常靜音統計(排除雙講剪切所致的靜音幀)。取值范圍[0,100],單位為百分比(%)。 |
Saturated Ratio(%) | 語音段中出現爆音占有話段的比例,用于輔助判斷采集音量過大導致的大范圍爆音問題。取值范圍[0,100],單位為百分比(%)。 |
Worst MOS(0-5) | 打分過程中的最低MOS,取值范圍[0,5]。 |
Worst Discontinuity(0-5) | 打分過程中最嚴重的斷續程度,取值范圍[0,5]。 |
Worst Noisiness(0-5) | 打分過程中噪聲最大的程度,取值范圍[0,5]。 |
Worst Coloration(0-5) | 打分過程中最差的語音自然度,取值范圍[0,5]。 |
美顏:FaceBeauty
Job參數說明:
名稱 | 類型 | 是否必填 | 描述 |
beauty_params | String | 否 | 美顏功能參數,填寫示例: "whiten=20,smooth=50,face_thin=50" |
回調示例
JSON格式
{
"Code":"Success",
"Details":[],
"FunctionName":"FaceBeauty",
"JobId":"39f8e0bc005e4f309379701645f4****",
"Message":"success",
"State":"Success",
"Type":"IProduction"
}
參數說明
參數 | 類型 | 說明 |
skin_beauty_enable | int | 美膚開關。
|
shape_beauty_enable | int | 美型開關。
|
whiten | int | 美白的力度,值越大,膚色區域將會越白。
|
smooth | int | 平滑的力度,值越大,膚色區域越模糊。
|
detail | int | 膚色細節的顆粒度,值越大,真實膚色的顆粒感越重,細節越多。
|
skin_model | int | 開啟時,美白只會作用在檢測為皮膚的區域。
|
cheek_thin | float | 瘦額骨。
|
face_cut | float | 削臉。
|
face_thin | float | 瘦臉。
|
face_length | float | 臉長調節(雙向)。
|
chin_length | float | 下巴長度調節(雙向)。
|
chin_thin | float | 瘦下巴。
|
eye_size | float | 眼睛變大。
|
eye_corner1 | float | 豎直方向調節眼角(雙向)。
|
eye_distance | float | 調節眼距(雙向)。
|
nose_thin | float | 瘦鼻子(雙向)。
|
nose_wing | float | 瘦鼻翼(雙向)。
|
nose_length | float | 鼻長調節(雙向)。
|
mouth_size | float | 嘴巴大小調節(雙向)。
|
mouth_position | float | 人中長度調節(雙向)。
|
lip_thickness | float | 嘴唇厚度調節(雙向)。
|
hair_line | float | 發際線調節(雙向)。
|
smile | float | 微笑。
|
detect_mode | float | 人臉檢測模式。
說明 視頻模式會使用多幀信息來追蹤人臉,使結果更加穩定。 |
detect_level | float | 人臉檢測器的分辨率。低分辨率下,比較小的人臉可能會漏。
|
threshold | float | 人臉檢測置信度閾值。
|
detect_interval | float | 視頻模式下的人臉檢測間隔幀數。
|
max_face_num | float | 最大支持的人臉個數。
|
min_face | float | 最小人臉的寬度。
|
Job參數說明
名稱 | 類型 | 描述 |
Result | String | 作業結果詳細信息,成功結果信息如:{"Code":"Success","Data":"{\"result\":[{\"file\":\"result.mp4\"}]}","Message":"Successful."} |
智能降噪:SpeechDenoise
輸入音頻文件,輸入音頻的格式需為WAV,采樣率為16khz或48khz。
輸出處理后的音頻文件,采樣率及格式同輸入文件一致。