有很多在线教程可以为Android应用添加语音识别功能.它们经常令人困惑,编码的出版商永远无法提问.我需要一个简单的教程,完整的编码,为我的应用添加语音识别.
我试图在文件中保存由android的语音识别服务监听的音频数据.
实际上我RecognitionListener按照这里的解释实现:
Android上的语音到文本
将数据保存到缓冲区中,如下所示: 捕获发送到Google语音识别服务器的音频
并将缓冲区写入Wav文件,如此处所示. Android将原始字节记录到HVEp Streaming的WAVE文件中
我的问题是如何获得适当的音频设置以保存在wav文件的标题中.事实上,当我播放wav文件时,只听到奇怪的噪音,这个参数,
short nChannels=2;// audio channels
int sRate=44100; // Sample rate
short bSamples = 16;// byteSample
Run Code Online (Sandbox Code Playgroud)
或者没有这个:
short nChannels=1;// audio channels
int sRate=8000; // Sample rate
short bSamples = 16;// byteSample
Run Code Online (Sandbox Code Playgroud)
令人困惑的是从logcat查看语音识别任务的参数我发现第一个Set PLAYBACK采样率为44100 HZ:
12-20 14:41:34.007: DEBUG/AudioHardwareALSA(2364): Set PLAYBACK PCM format to S16_LE (Signed 16 bit Little Endian)
12-20 14:41:34.007: DEBUG/AudioHardwareALSA(2364): Using 2 channels for PLAYBACK.
12-20 14:41:34.007: DEBUG/AudioHardwareALSA(2364): Set PLAYBACK sample rate to 44100 HZ
12-20 14:41:34.007: DEBUG/AudioHardwareALSA(2364): …Run Code Online (Sandbox Code Playgroud) Chrome实施了HTML5语音识别API.支持多种语言.我想知道支持哪些语言以及HTML元素lang属性中使用的每种语言的相应代码.
例如:
谢谢!
html5 voice speech-recognition google-chrome voice-recognition
我在Android上使用了语音识别功能,我喜欢它.这是我的客户最受好评的功能之一.但是,格式有些限制.你必须调用识别器意图,让它将转录的录音发送到谷歌,并等待文本回来.
我的一些想法需要在我的应用程序中录制音频,然后将剪辑发送到谷歌进行转录.
有没有什么方法可以发送音频剪辑进行语音处理?
我不确定这是否是这个问题的正确网站,但我想知道在Google主页上的语音激活搜索是如何工作的.它是否使用Flash,谷歌Chrome内置的某种插件,或者它如何使用麦克风?如果允许在任何网站上以相同的方式工作,这可能是一个危险的隐私入侵,因为没有要求许可的对话框出现,我发现谷歌(以及谁知道其他网站)可以在没有我的情况下使用我的麦克风这令人吃惊允许.谷歌如何做到这一点?JavaScript的?动作?一些自定义插件?
我正在开发一个基于语音识别的Android应用程序.
直到今天,一切都工作得很好并且及时,例如,我会开始我的语音识别器,说话,并且在最多1或2秒内,应用程序收到结果.
这是一个非常可接受的用户体验.
那么今天我现在必须等待十秒或更长时间才能获得识别结果.
我尝试过设置以下EXTRAS,其中没有一个会产生任何明显的区别
RecognizerIntent.EXTRA_SPEECH_INPUT_POSSIBLY_COMPLETE_SILENCE_LENGTH_MILLIS
RecognizerIntent.EXTRA_SPEECH_INPUT_COMPLETE_SILENCE_LENGTH_MILLIS
RecognizerIntent.EXTRA_SPEECH_INPUT_MINIMUM_LENGTH_MILLIS
Run Code Online (Sandbox Code Playgroud)
我一直在不断更改我的应用程序,但这些更改都与语音识别器无关.
我可以采用任何方法来缩短语音识别器切换onBeginningOfSpeech()到的时间onResults()吗?
这是一个需要多长时间的例子
07-01 17:50:20.839 24877-24877/com.voice I/Voice: onReadyForSpeech()
07-01 17:50:21.614 24877-24877/com.voice I/Voice: onBeginningOfSpeech()
07-01 17:50:38.163 24877-24877/com.voice I/Voice: onEndOfSpeech()
Run Code Online (Sandbox Code Playgroud) android speech-recognition voice-recognition google-voice-search
在我的基于语音识别的应用程序中,我有时会收到ERROR_RECOGNIZER_BUSY.直觉上,这需要...... 重试,对吧?
问题是这个错误是非常无证的,所以很明显我有些问题可能是在该领域更有经验的人能够回答:
我们非常欢迎您经验丰富的见解.谢谢.
我想尝试使用简单的语音命令(如"next"或"previous")创建jQuery幻灯片.有没有办法使用谷歌的语音识别?我知道Chrome的x-webkit-speech,但我必须单击一个按钮才能使用它.
我尝试了麻省理工学院的WAMI,但我发现它比谷歌的语音认知更慢,更准确.
javascript jquery speech-recognition google-api voice-recognition
我有一个音频文件(录制的2人电话).我需要自动分离2个扬声器的声音.我是语音识别的新手,我看了python的wave模块但是找不到任何有用的信息.
请帮助如何开始.还请建议我免费的python库,它将帮助我解决问题.
我正在使用Window的语音识别API,并且它一直在检测非常低的背景噪音作为"if"重复的单词.我一直试图找到一种方法来为它开始接受输入的最小量要求,但其所有成员都设置为只读.
如何设置麦克风音量的最小截止值?
编辑:找出一种获得平均值的方法,如果它低于我想要的平均值,则忽略文本
public void hRecognition_AudioStateChanged(object sender, AudioStateChangedEventArgs e)
{
if (e.AudioState == AudioState.Stopped)
{
volumeAverage /= volumeCount;
}
else if (e.AudioState == AudioState.Speech)
{
volumeAverage = 0;
volumeCount = 0;
}
}
public void hRecognition_AudioLevelUpdated(object sender, AudioLevelUpdatedEventArgs e)
{
volumeAverage += e.AudioLevel;
volumeCount += 1;
}
Run Code Online (Sandbox Code Playgroud)