產(chǎn)品公共FAQ
本文匯總了您在使用智能語音交互產(chǎn)品過程中的常見問題。
產(chǎn)品公共常見問題主要分為以下幾類:
功能類
性能類
SDK使用類
計(jì)費(fèi)類
功能類
使用阿里云音視頻通信RTC如何調(diào)用語音識(shí)別服務(wù)?
使用阿里云音視頻通信RTC服務(wù)可以集成智能語音交互服務(wù),具體請參見語音數(shù)據(jù)處理。
智能語音交互服務(wù)中語音識(shí)別和語音合成用到的端口是哪些?
對(duì)于HTTP協(xié)議,端口號(hào)為80;對(duì)于HTTPS和Websocket協(xié)議,端口號(hào)為443。
開通商用或者擴(kuò)容并發(fā),多久才會(huì)在控制臺(tái)上顯示?
可用并發(fā)路數(shù)為實(shí)時(shí)更新顯示,昨日并發(fā)路數(shù)為T+1更新。另外,控制臺(tái)顯示的計(jì)量數(shù)據(jù)是T+1規(guī)則,第二天更新數(shù)據(jù)。
智能語音交互創(chuàng)建的項(xiàng)目數(shù)量有限制嗎?
目前沒有限制。
控制臺(tái)一個(gè)項(xiàng)目下支持多個(gè)基礎(chǔ)模型嗎?
不支持。一個(gè)Appkey對(duì)應(yīng)一個(gè)模型。
有沒有H5語音喚醒相應(yīng)的技術(shù)和插件?
設(shè)備端暫不支持此功能,云端支持。如果是設(shè)備端,一般會(huì)采用端云結(jié)合的方案。設(shè)備端側(cè)有一個(gè)喚醒模型,設(shè)備端喚醒后結(jié)合云端模型二次確認(rèn)降低誤喚醒的概率。
如何在阿里云查詢賬號(hào)下ASR語音識(shí)別服務(wù)的使用情況?
您可以在控制臺(tái)直觀地查看智能語音交互服務(wù)的調(diào)用情況,包括時(shí)長、次數(shù)、并發(fā)路數(shù)等,根據(jù)運(yùn)營數(shù)據(jù)判斷當(dāng)前使用是否合理,并決策是否需要增加或減少相關(guān)服務(wù)調(diào)用量。具體請參見服務(wù)用量。
智能語音交互服務(wù)有哪些域名?這些域名對(duì)應(yīng)IP地址有哪些?
智能語音交互服務(wù)的域名為nls-meta.cn-shanghai.aliyuncs.com
和nls-gateway-cn-shanghai.aliyuncs.com
,端口為80、443,支持HTTPS和Websocket協(xié)議。
可通過命令dig nls-gateway-cn-shanghai.aliyuncs.com
或dig nls-meta.cn-shanghai.aliyuncs.com
查看域名對(duì)應(yīng)的IP地址。這些IP地址是動(dòng)態(tài)IP,可能會(huì)不定期有更新,需要調(diào)用方自行監(jiān)控。
找不到AccessKey ID和AccessKey Secret在哪里?
請參見開通服務(wù),獲取AccessKey ID和AccessKey Secret。
如何查看UID?
登錄阿里云控制臺(tái)。
將鼠標(biāo)懸浮在右上角用戶頭像上,彈出的面板信息中的賬號(hào)ID即為UID。
智能語音交互是否有供參考的教程?
以下是相關(guān)的功能的視頻介紹:
性能類
ASR語音識(shí)別和TTS語音合成超并發(fā)會(huì)有什么現(xiàn)象?
超并發(fā)可能會(huì)出現(xiàn)以下情況:
查看日志會(huì)有大量超時(shí)現(xiàn)象,具體服務(wù)狀態(tài)碼為40000005,表示請求數(shù)量過多。
如果并發(fā)量較大時(shí)會(huì)導(dǎo)致ASR語音識(shí)別和TTS語音合成斷開連接。
免費(fèi)用戶有什么限制?
一句話識(shí)別、實(shí)時(shí)語音識(shí)別:最多同時(shí)發(fā)送2路語音識(shí)別。
錄音文件識(shí)別:新用戶試用期3個(gè)月內(nèi),每隔24小時(shí)可免費(fèi)識(shí)別2小時(shí)時(shí)長的文件轉(zhuǎn)寫服務(wù)。免費(fèi)額度用完后,間隔24小時(shí)后可繼續(xù)試用。
并發(fā)數(shù)是如何計(jì)算的?
并發(fā)數(shù)指同一個(gè)賬號(hào)(阿里云UID)同時(shí)在處理的請求數(shù)。
一般語音請求的處理都會(huì)延續(xù)一段時(shí)間,例如用戶新建一個(gè)語音識(shí)別請求,持續(xù)發(fā)送語音數(shù)據(jù)給服務(wù)端,這時(shí)并發(fā)數(shù)就是1;在這個(gè)請求處理的同時(shí),同一用戶又新建了另一個(gè)請求,開始發(fā)送語音數(shù)據(jù),這時(shí)服務(wù)端同時(shí)在處理這個(gè)賬號(hào)的兩個(gè)請求,并發(fā)數(shù)就變成2。
SDK使用類
智能語音交互是否提供相關(guān)的源碼呢?
SDK協(xié)議及源碼已經(jīng)開源,具體請參見Github。目前開源的有C++、Java和Python語言版本。
如有需要研究智能語音交互的協(xié)議架構(gòu),可以參考Github中的源碼實(shí)現(xiàn)。建議您直接使用智能語音交互產(chǎn)品提供的SDK版本進(jìn)行集成,具體請參見從這里開始。對(duì)自行研究協(xié)議實(shí)現(xiàn)的API很難提供更多支持。
智能語音交互的Android SDK支持在多進(jìn)程中初始化多個(gè)實(shí)例嗎?
目前不支持。
語音合成SDK播放聲音有播放完成的監(jiān)聽嗎,確認(rèn)下有沒有播放語音模塊?
播放不屬于SDK,SDK只有合成事件。
音頻數(shù)據(jù)必須連續(xù)發(fā)送嗎?
音頻數(shù)據(jù)必須連續(xù)發(fā)送。
服務(wù)端在超過一定時(shí)間未接到語音數(shù)據(jù)(10秒)會(huì)超時(shí)斷開連接,返回40000004錯(cuò)誤信息。如果需要再次發(fā)送數(shù)據(jù),客戶端需要重新發(fā)起請求。
音頻數(shù)據(jù)發(fā)送中斷后,為什么還會(huì)收到服務(wù)器發(fā)回的數(shù)據(jù)?
音頻數(shù)據(jù)未連續(xù)發(fā)送超時(shí)中斷后,服務(wù)器上如果還有之前未處理完的數(shù)據(jù),就會(huì)繼續(xù)返回這些數(shù)據(jù)的識(shí)別結(jié)果,但是整個(gè)句子的識(shí)別已經(jīng)是錯(cuò)誤的了。
初始化失敗的可能原因?
請檢查是否使用正確的AccessKey ID、AccessKey Secret生成Access Token,并填入正確Appkey、Access Token、Workspace等必選參數(shù)。
開始識(shí)別失敗的可能原因?
SDK為單例模式,請確認(rèn)上一個(gè)識(shí)別已經(jīng)結(jié)束后再開始新的識(shí)別。
為何開始識(shí)別后沒有識(shí)別結(jié)果?
確認(rèn)如下信息:
初始化成功。
開始識(shí)別接口調(diào)用成功,且正確使用參數(shù)vad_mode。
有音頻狀態(tài)回調(diào)返回且已正確開啟錄音。
無問題的情況下,若仍然沒有識(shí)別結(jié)果,則一般會(huì)有EVENT_ASR_ERROR事件發(fā)生,根據(jù)事件攜帶的錯(cuò)誤碼進(jìn)行定位。
計(jì)費(fèi)類
實(shí)時(shí)語音識(shí)別最大并發(fā)可以買多少路?
試用版免費(fèi)2路并發(fā),3個(gè)月有效期;開通商用后默認(rèn)200路并發(fā),可單獨(dú)擴(kuò)充并發(fā)資源包。
英文的識(shí)別,需要購買擴(kuò)展語言包還是要買路數(shù)?
英文識(shí)別需要購買擴(kuò)展包和購買路數(shù)。