提高 Google Cloud Speech API 的准确性

Question

我目前正在 Mac OS 计算机上从网页录制音频，并通过云语音 api 运行它以生成成绩单。但是，结果并不那么准确，并且结果中存在大量缺失的单词。

是否有任何步骤可以帮助我产生更准确的结果？

以下是我将音频转换为文本的步骤：

Answer 1

从Speech-to-Text API方面，我建议您验证您是否遵循最佳实践建议，例如避免过多的背景噪音和多人同时交谈，因为这些方面会影响服务识别。

我认为你有一个很好的采样率和宽松的编解码器；但是，请记住，音频预处理会影响音频质量。在这些情况下，最好避免重新采样，不过，您可以尝试使用不同的音频格式来验证哪种格式可以获得最准确的结果。

此外，您可以使用通常用于提高识别准确性的languageCode和短语提示API 属性。