我正在使用 Google Cloud Platform Speech-to-Text API 试用帐户服务。我无法从音频文件中获取文本。我不知道比特率 128kbps 的 MP3 文件应该使用什么确切的编码和采样率 Hertz。我尝试了各种选项,但没有得到转录。
const speech = require('@google-cloud/speech');
const config = {
encoding: 'LINEAR16', //AMR, AMR_WB, LINEAR16(for wav)
sampleRateHertz: 16000, //16000 giving blank result.
languageCode: 'en-US'
};
Run Code Online (Sandbox Code Playgroud) 我有一个包含MP3流的字节数组.
如果我希望能够转换为WAV,那么假设必须进一步解码此流是否正确?
在当前字节状态下,是否可以执行基本功能,例如获取/设置位置(按时间)?