智能語音交互服務(wù),是一種人機(jī)交互技術(shù),它允許用戶通過語音與機(jī)器進(jìn)行自然的對(duì)話和溝通。
接口說明
- SmartCall 需要與智能外呼回調(diào) HTTP 接口聯(lián)合使用,語音平臺(tái)發(fā)起呼叫后會(huì)把轉(zhuǎn)換后的語音文本回傳給業(yè)務(wù)方,業(yè)務(wù)方把下一步的執(zhí)行動(dòng)作返回給語音平臺(tái)。
- 以下字符不可以在智能語音交互 SmartCall 回調(diào)中出現(xiàn):
@ = : "" $ { } ^ * ¥
。
調(diào)試
您可以在OpenAPI Explorer中直接運(yùn)行該接口,免去您計(jì)算簽名的困擾。運(yùn)行成功后,OpenAPI Explorer可以自動(dòng)生成SDK代碼示例。
授權(quán)信息
請(qǐng)求參數(shù)
名稱 | 類型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
CalledShowNumber | string | 是 | 被叫顯號(hào)。必須是已購(gòu)買的號(hào)碼。 您可以登錄語音服務(wù)控制臺(tái),在語音號(hào)碼>真實(shí)號(hào)管理頁面查看已購(gòu)買的號(hào)碼。 | 0571****5678 |
CalledNumber | string | 是 | 被叫號(hào)碼。僅支持中國(guó)內(nèi)地號(hào)碼。 | 1590****0000 |
VoiceCode | string | 是 | 智能外呼放音文件。 當(dāng)放音文件為控制臺(tái)上傳的語音文件時(shí):參數(shù) VoiceCode 指定為文件的語音 ID。您可以登錄語音服務(wù)控制臺(tái),選擇語音文件管理>智能語音交互放音文件,單擊詳情查看對(duì)應(yīng)的語音 ID。 | 2d4c-4e78-8d2a-afbb06cf****.wav,$name$ |
RecordFlag | boolean | 否 | 通話過程中是否錄音。取值:
| true |
Volume | integer | 否 | 播放用戶音頻的音量。取值范圍:-4~4,建議設(shè)置為 1。 | 1 |
Speed | integer | 否 | 參數(shù)暫不支持使用。 | 1 |
AsrModelId | string | 否 | ASR 模型。取值:
說明
調(diào)用 SmartCall 接口時(shí)需要指定使用的 ASR 模型,建議參數(shù) AsrModelId 和 AsrBaseId 二者選填其一。
| customer_service_8k |
PauseTime | integer | 否 | 停頓時(shí)長(zhǎng)。用于設(shè)置用戶停頓多久表示一句話結(jié)束。單位:毫秒,取值范圍:300~1200。 說明
| 800 |
MuteTime | integer | 否 | 靜音時(shí)長(zhǎng)。用于設(shè)置用戶多久不說話通話結(jié)束。單位:毫秒,取值范圍:1000~20000。 說明
| 10000 |
ActionCodeBreak | boolean | 否 | 當(dāng)前返回的媒體文件是否可以被打斷。默認(rèn)取值為 true,即可被打斷。 如果為 false,即使下一個(gè)動(dòng)作 action_break 為 true,也無法打斷當(dāng)前放音。 說明
action_code_break 優(yōu)先級(jí)高于 action_break。
| true |
OutId | string | 否 | 預(yù)留給調(diào)用方使用的 ID。 最終會(huì)通過在回執(zhí)消息中將此 ID 帶回給調(diào)用方。 字符串類型,長(zhǎng)度為 1~15 個(gè)字節(jié)。 | 342268***** |
DynamicId | string | 否 | 預(yù)留給調(diào)用方使用的動(dòng)態(tài)擴(kuò)展 ID。在回調(diào)地址中帶回,用于客戶的開發(fā)標(biāo)識(shí)。 | abcdefgh |
EarlyMediaAsr | boolean | 否 | 早媒體語音識(shí)別標(biāo)識(shí)。取值:
說明
設(shè)為 true 會(huì)記錄通話未接聽的原因。
| true |
VoiceCodeParam | string | 否 | TTS 參數(shù)傳遞字符串,格式為 JSON。必須與 VoiceCode 的 TTS 參數(shù)對(duì)應(yīng)。 | {"name":"喂,你好"} |
SessionTimeout | integer | 否 | 最大通話時(shí)長(zhǎng),超時(shí)后自動(dòng)掛斷。單位:秒。 說明
通話時(shí)長(zhǎng)最長(zhǎng) 3600 秒。
| 120 |
ActionCodeTimeBreak | integer | 否 | 基于用戶持續(xù)說話時(shí)長(zhǎng)打斷。單位:毫秒。 如果當(dāng)前媒體文件 ActionCodeBreak 為 true,用戶持續(xù)說話可以打斷當(dāng)前播放。不設(shè)置或者為 0,不生效。 | 120 |
TtsStyle | string | 否 | TTS 變量播放時(shí)的聲音風(fēng)格。默認(rèn)為 xiaoyun。具體風(fēng)格,請(qǐng)參見下表聲音風(fēng)格列表。 | xiaoyun |
TtsVolume | integer | 否 | TTS 變量播放的音量。取值范圍:0~100,默認(rèn)值為 0。 | 10 |
TtsSpeed | integer | 否 | TTS 變量播放時(shí)的聲音速度。取值范圍:-200~200,默認(rèn)值為 0。 | 100 |
TtsConf | boolean | 否 | 是否設(shè)置 TTS 聲音參數(shù)。取值:
| true |
AsrBaseId | string | 否 | ASR 基礎(chǔ)模型。取值:
說明
調(diào)用 SmartCall 接口時(shí)需要指定使用的 ASR 模型,建議參數(shù) AsrModelId 和 AsrBaseId 二者選填其一。
| customer_service_8k |
StreamAsr | integer | 否 | 流式 ASR,根據(jù)用戶說的前幾個(gè)字智能判斷語義。取值:
| 1 |
BackgroundFileCode | string | 否 | 用戶和機(jī)器人對(duì)話時(shí)播放的背景語音文件 ID。 您可以登錄語音服務(wù)控制臺(tái),選擇語音文件管理>智能語音交互放音文件,單擊詳情按鈕,查看對(duì)應(yīng)的語音 ID。 | 2d4c-4e78-8d2a-afbb06cf****.wav |
BackgroundVolume | integer | 否 | 參數(shù)暫不支持使用。 | 1 |
BackgroundSpeed | integer | 否 | 參數(shù)暫不支持使用。 | 1 |
EnableITN | boolean | 否 | 是否在后處理中執(zhí)行 ITN。默認(rèn)為 false,即不執(zhí)行。 設(shè)置為 true 時(shí),中文數(shù)字將轉(zhuǎn)為阿拉伯?dāng)?shù)字輸出。 | false |
聲音風(fēng)格
更多聲音風(fēng)格詳情,請(qǐng)參見聲音風(fēng)格列表。
返回參數(shù)
示例
正常返回示例
JSON
格式
{
"Code": "OK",
"Message": "OK",
"RequestId": "A90E4451-FED7-49D2-87C8-00700A8C4D0D",
"CallId": "116012854210^10281427****"
}
錯(cuò)誤碼
訪問錯(cuò)誤中心查看更多錯(cuò)誤碼。
變更歷史
變更時(shí)間 | 變更內(nèi)容概要 | 操作 |
---|---|---|
2024-04-18 | OpenAPI 入?yún)l(fā)生變更 | 查看變更詳情 |