沃森演讲文本响应时间

Den*_*ams 2 api speech-to-text ibm-watson ibm-cloud

在推送Bluemix的同时遇到一些麻烦

我通过php-curl发送的推送请求是:

POST https://stream.watsonplatform.net/speech-to-text/api/v1/recognize

具有以下参数

    model:en-US_NarrowbandModel
    Content-Type:audio/wav; rate:8000
    Transfer-Encoding:     chunked
    timestamps:true
word_confidence:true
    continuous:true

响应超时设置为2h(7200000毫秒)

我们的一些文件因为卷曲而暂停,没有任何明显的原因,起初我认为这与录制的持续时间有关,但是我已经有成功请求音频文件的日志〜200秒长和超时录音129秒.

我认为这可能是一个超时问题或音频文件上传中的一些错误,所以我开始调查会话但我不清楚如何会话过程工作,我不能在文档中对其进行排序.

以下文档(https://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/speech-to-text/api/v1/)

如果我能得到一些反馈/建议我做错了什么,我会很高兴...

谢谢...

Dan*_*nos 5

如果您提交的文件很长,则REST接口可能会导致超时,即使您使用会话也是如此.一般来说,我建议您尝试使用Watson Speech To Text服务的WebSockets接口.这个界面也比使用会话的REST界面简单得多,你不应该有任何超时问题.如果您的文件包含非常长的静音,请不要忘记将inactivity_timeout参数设置为更高的值,例如600.

文档在这里:

https://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/doc/speech-to-text/websockets.shtml

python中的一个简单的工作示例如下:

https://github.com/watson-developer-cloud/speech-to-text-websockets-python

达尼