我试图在文件中保存由android的语音识别服务监听的音频数据.
实际上我RecognitionListener按照这里的解释实现:
Android上的语音到文本
将数据保存到缓冲区中,如下所示: 捕获发送到Google语音识别服务器的音频
并将缓冲区写入Wav文件,如此处所示. Android将原始字节记录到HVEp Streaming的WAVE文件中
我的问题是如何获得适当的音频设置以保存在wav文件的标题中.事实上,当我播放wav文件时,只听到奇怪的噪音,这个参数,
short nChannels=2;// audio channels
int sRate=44100; // Sample rate
short bSamples = 16;// byteSample
Run Code Online (Sandbox Code Playgroud)
或者没有这个:
short nChannels=1;// audio channels
int sRate=8000; // Sample rate
short bSamples = 16;// byteSample
Run Code Online (Sandbox Code Playgroud)
令人困惑的是从logcat查看语音识别任务的参数我发现第一个Set PLAYBACK采样率为44100 HZ:
12-20 14:41:34.007: DEBUG/AudioHardwareALSA(2364): Set PLAYBACK PCM format to S16_LE (Signed 16 bit Little Endian)
12-20 14:41:34.007: DEBUG/AudioHardwareALSA(2364): Using 2 channels for PLAYBACK.
12-20 14:41:34.007: DEBUG/AudioHardwareALSA(2364): Set PLAYBACK sample rate to 44100 HZ
12-20 14:41:34.007: DEBUG/AudioHardwareALSA(2364): …Run Code Online (Sandbox Code Playgroud) 我在Android上使用了语音识别功能,我喜欢它.这是我的客户最受好评的功能之一.但是,格式有些限制.你必须调用识别器意图,让它将转录的录音发送到谷歌,并等待文本回来.
我的一些想法需要在我的应用程序中录制音频,然后将剪辑发送到谷歌进行转录.
有没有什么方法可以发送音频剪辑进行语音处理?
您可能知道,使用Android API实现语音到文本非常简单.您所要做的就是调用API的意图,它将为您返回文本.我的情况有点不同,我有一个预先录制的3GPP声音文件,我已经从用户录制并保存在SD卡上.我想知道是否可以将其转录为文本,就像任何其他语音识别一样.语音到文本API是否允许上传您自己要处理的声音文件?或者这不可能吗?
可能重复:
Android上的语音识别与录制的声音剪辑?
我正在开发一个Android应用程序,它将音频录制到文件,然后使用语音识别从录制的语音中获取文本.
是否有语音识别库可用于此类任务?我该如何开始?