相关疑难解决方法(0)

保存Android Stock语音识别引擎的音频输入

我试图在文件中保存由android的语音识别服务监听的音频数据.

实际上我RecognitionListener按照这里的解释实现: Android上的语音到文本

并将缓冲区写入Wav文件,如此处所示. Android将原始字节记录到HVEp Streaming的WAVE文件中

我的问题是如何获得适当的音频设置以保存在wav文件的标题中.事实上,当我播放wav文件时,只听到奇怪的噪音,这个参数,

short nChannels=2;// audio channels
int sRate=44100;    // Sample rate
short bSamples = 16;// byteSample

Run Code Online (Sandbox Code Playgroud)

或者没有这个:

short nChannels=1;// audio channels
int sRate=8000;    // Sample rate
short bSamples = 16;// byteSample

Run Code Online (Sandbox Code Playgroud)

令人困惑的是从logcat查看语音识别任务的参数我发现第一个Set PLAYBACK采样率为44100 HZ:

    12-20 14:41:34.007: DEBUG/AudioHardwareALSA(2364): Set PLAYBACK PCM format to S16_LE (Signed 16 bit Little Endian)
    12-20 14:41:34.007: DEBUG/AudioHardwareALSA(2364): Using 2 channels for PLAYBACK.
    12-20 14:41:34.007: DEBUG/AudioHardwareALSA(2364): Set PLAYBACK sample rate to 44100 HZ
    12-20 14:41:34.007: DEBUG/AudioHardwareALSA(2364): …

Run Code Online (Sandbox Code Playgroud)

audio android speech-recognition wav voice-recognition

mmm*_*mmx

2017 05-23

38
推荐指数

1
解决办法

7239
查看次数

从语音识别意图中记录/保存音频

在提出这个问题之前,我检查了所有与此问题相关的stackoverflow其他线程没有任何成功,所以请不要回答其他线程的链接,:)

我想保存/记录谷歌识别服务用于语音操作的音频(使用RecognizerIntent或SpeechRecognizer).

我经历了很多想法:

来自RecognitionListener的onBufferReceived:我知道,这不起作用,只是测试它看看会发生什么,而onBufferReceived永远不会被调用(使用JB 4.3在galaxy nexus上测试)
使用媒体录像机:不工作.它突破了语音识别.麦克风只允许一个操作
试图找到识别服务在执行语音之前保存临时音频文件到文本api复制它的地方,但没有成功

我几乎绝望,但我只是注意到Google Keep应用程序正在做我需要做的事情!我使用logcat稍微调试了keep应用程序,app也调用了"RecognizerIntent.ACTION_RECOGNIZE_SPEECH"(就像我们开发人员一样)来触发语音到文本.但是,如何继续保存音频？它可以成为隐藏的api吗？是谷歌"作弊":)？

谢谢您的帮助

最好的祝福

android speech-recognition speech-to-text

Sli*_*lim

2017 12-30

24
推荐指数

2
解决办法

2万
查看次数