Android上的语音识别与录制的声音剪辑?

Cod*_*ile 31 android voice speech-recognition voice-recognition

我在Android上使用了语音识别功能,我喜欢它.这是我的客户最受好评的功能之一.但是,格式有些限制.你必须调用识别器意图,让它将转录的录音发送到谷歌,并等待文本回来.

我的一些想法需要在我的应用程序中录制音频,然后将剪辑发送到谷歌进行转录.

有没有什么方法可以发送音频剪辑进行语音处理?

lsa*_*san 10

我找到了一个能够很好地进行语音识别和录音的解决方案.以下是我创建的简单Android项目的链接,以显示解决方案的工作原理.此外,我在项目中放置了一些打印屏幕来说明应用程序.

我将尝试简要解释我使用的方法.我在该项目中结合了两个功能:Google Speech API和Flac录制.

Google Speech API通过HTTP连接调用.Mike Pultz提供了有关API的更多详细信息:

"(...)新的[Google] API是一个全双工流API.这意味着,它实际上使用了两个HTTP连接 - 一个POST请求将内容上传为"实时"分块流,以及第二个GET请求访问结果,这对于更长的音频样本或流式音频更有意义."

但是,此API需要接收FLAC声音文件才能正常工作.这让我们进入第二部分:Flac录音

我通过从名为AudioBoo的开源应用程序中提取和调整一些代码和库来实现该项目中的Flac记录.AudioBoo使用本机代码来记录和播放flac格式.

因此,可以录制flac声音,将其发送到Google Speech API,获取文本,然后播放刚录制的声音.

我创建的项目具有使其工作的基本原则,并且可以针对特定情况进行改进.为了使其在不同的场景中工作,有必要获得一个Google Speech API密钥,该密钥是通过成为Google Chromium-dev组的一部分获得的.我在该项目中留下了一个密钥,只是为了表明它正在工作,但我最终会删除它.如果有人需要更多相关信息,请告诉我原因我在这篇文章中无法输入超过2个链接.


Tre*_*hns 5

不幸的是现在不是。Android 语音识别服务当前支持的唯一接口是RecognizerIntent,它不允许您提供自己的声音数据。

如果您希望看到此内容,请在http://b.android.com上提交功能请求。这也与现有的问题 4541问题 36915103无关。

  • Google 是否提供任何工具来评估识别器或语言模型的准确性?我们通常通过运行具有已知转录的预先记录的样本来评估识别器的准确性。有没有办法可以测试 Google 识别器以了解它对我的应用程序是否有效?我还想根据我预先录制的样本测试这两种语言模型,以确定哪个提供更好的准确性。我有什么办法可以做到这一点吗? (2认同)