我正在对Google Cloud Speech API执行异步请求,我不知道如何获取操作结果:
请求POST: https ://speech.googleapis.com/v1beta1/speech: asyncrecognize
身体:
{
"config":{
"languageCode" : "pt-BR",
"encoding" : "LINEAR16",
"sampleRate" : 16000
},
"audio":{
"uri":"gs://bucket/audio.flac"
}
}
Run Code Online (Sandbox Code Playgroud)
哪个回报:
{ "name": "469432517" }
所以,我做了一个POST:https://speech.googleapis.com/v1beta1/operations/469432517
哪个回报:
{
"name": "469432517",
"metadata": {
"@type": "type.googleapis.com/google.cloud.speech.v1beta1.AsyncRecognizeMetadata",
"progressPercent": 100,
"startTime": "2016-08-11T21:18:29.985053Z",
"lastUpdateTime": "2016-08-11T21:18:31.888412Z"
},
"done": true,
"response": {
"@type": "type.googleapis.com/google.cloud.speech.v1beta1.AsyncRecognizeResponse"
}
}
Run Code Online (Sandbox Code Playgroud)
我需要得到操作的结果:转录的文本.
我怎样才能做到这一点?
我正在尝试使用Google的Cloud Speech API.这里有文档和代码示例:
https://cloud.google.com/speech/docs/basics
https://cloud.google.com/speech/docs/rest-tutorial
Run Code Online (Sandbox Code Playgroud)
如果我将它指向包含的文件audio.raw,但是没有简短的.wav文件,我可以让示例代码运行得很好.
我不知道音频样本文件的格式是什么:
$ file audio.raw
audio.raw: data
Run Code Online (Sandbox Code Playgroud)
我的.wav文件可能有10秒的音频,我得到一个空的结果.
我知道这个答案.
我之前曾问过我的问题,但问题没有答案.
我无法想象我必须得到音频文件的属性恰到好处才能使其工作.我假设一个常见的用例,我的是,有人录制会议,不知道录制的参数,只是想要一个文本文件.
audio google-cloud-platform google-voice-search google-speech-api