通过 Twillio 录制的电话进行实时语音识别

Dav*_*vid 5 speech-recognition speech-to-text twilio

我目前正在使用 Twilio 打电话,我想添加一个语音识别元素,这样如果用户说出特定的短语,我的后端就可以采取特定的操作。如果您熟悉 Twilio,它类似于 Gather 动词。它必须是实时的,因为如果识别出现问题,系统会提示用户进行澄清。

小智 2

要将语音识别添加到 Twilio Gather 动词,请将“speech”添加到 Gather 输入值,例如:input="dtmf voice"。在呼叫者说了些什么并且安静后,Twilio 服务器会将语音翻译为文本并将文本发送到操作 URL,然后等待响应指令。您的程序可以使用文本来响应您选择的方式。一种选择是让您的程序以更正指令(说出动词)进行响应,并让调用者说出更多内容,这些内容将由您的操作 URL 再次处理。

Twilio 收集文档,包括语音识别的实现: https://www.twilio.com/docs/api/twiml/gather

使用语音识别标识符的带有 Gather 动词的 TwiML 示例。

<?xml version="1.0" encoding="UTF-8"?>
<Response>
    <Gather input="dtmf speech" language="en-us"
          numDigits="1"
          timeout="6"
          action="http://hostname/processUserResponse.py">
        <Say voice="alice" language="en-CA">
            Okay, speech recognition test. Enter any digit or say something.
        </Say>
    </Gather>
    <Say voice="alice" language="en-CA">
        Waited to long to say something. Response canceled ....
    </Say>
</Response>
Run Code Online (Sandbox Code Playgroud)