标签: voice-recognition

如何:语音命令到Android应用程序

有很多在线教程可以为Android应用添加语音识别功能.它们经常令人困惑,编码的出版商永远无法提问.我需要一个简单的教程,完整的编码,为我的应用添加语音识别.

java android voice-recognition

55
推荐指数
2
解决办法
6万
查看次数

保存Android Stock语音识别引擎的音频输入

我试图在文件中保存由android的语音识别服务监听的音频数据.

实际上我RecognitionListener按照这里的解释实现: Android上的语音到文本

将数据保存到缓冲区中,如下所示: 捕获发送到Google语音识别服务器的音频

并将缓冲区写入Wav文件,如此处所示. Android将原始字节记录到HVEp Streaming的WAVE文件中

我的问题是如何获得适当的音频设置以保存在wav文件的标题中.事实上,当我播放wav文件时,只听到奇怪的噪音,这个参数,

short nChannels=2;// audio channels
int sRate=44100;    // Sample rate
short bSamples = 16;// byteSample
Run Code Online (Sandbox Code Playgroud)

或者没有这个:

short nChannels=1;// audio channels
int sRate=8000;    // Sample rate
short bSamples = 16;// byteSample
Run Code Online (Sandbox Code Playgroud)

令人困惑的是从logcat查看语音识别任务的参数我发现第一个Set PLAYBACK采样率为44100 HZ:

    12-20 14:41:34.007: DEBUG/AudioHardwareALSA(2364): Set PLAYBACK PCM format to S16_LE (Signed 16 bit Little Endian)
    12-20 14:41:34.007: DEBUG/AudioHardwareALSA(2364): Using 2 channels for PLAYBACK.
    12-20 14:41:34.007: DEBUG/AudioHardwareALSA(2364): Set PLAYBACK sample rate to 44100 HZ
    12-20 14:41:34.007: DEBUG/AudioHardwareALSA(2364): …
Run Code Online (Sandbox Code Playgroud)

audio android speech-recognition wav voice-recognition

38
推荐指数
1
解决办法
7239
查看次数

Chrome实施HTML5语音识别API的语言代码是什么?

Chrome实施了HTML5语音识别API.支持多种语言.我想知道支持哪些语言以及HTML元素lang属性中使用的每种语言的相应代码.

例如:

  • 波兰语(pl-PL)
  • 土耳其语(tr-TR)

谢谢!

html5 voice speech-recognition google-chrome voice-recognition

34
推荐指数
3
解决办法
4万
查看次数

Android上的语音识别与录制的声音剪辑?

我在Android上使用了语音识别功能,我喜欢它.这是我的客户最受好评的功能之一.但是,格式有些限制.你必须调用识别器意图,让它将转录的录音发送到谷歌,并等待文本回来.

我的一些想法需要在我的应用程序中录制音频,然后将剪辑发送到谷歌进行转录.

有没有什么方法可以发送音频剪辑进行语音处理?

android voice speech-recognition voice-recognition

31
推荐指数
2
解决办法
3万
查看次数

Google语音搜索的工作原理?那有API吗?

我不确定这是否是这个问题的正确网站,但我想知道在Google主页上的语音激活搜索是如何工作的.它是否使用Flash,谷歌Chrome内置的某种插件,或者它如何使用麦克风?如果允许在任何网站上以相同的方式工作,这可能是一个危险的隐私入侵,因为没有要求许可的对话框出现,我发现谷歌(以及谁知道其他网站)可以在没有我的情况下使用我的麦克风这令人吃惊允许.谷歌如何做到这一点?JavaScript的?动作?一些自定义插件?

html javascript voice-recognition

30
推荐指数
2
解决办法
3万
查看次数

Google语音识别超时

我正在开发一个基于语音识别的Android应用程序.

直到今天,一切都工作得很好并且及时,例如,我会开始我的语音识别器,说话,并且在最多1或2秒内,应用程序收到结果.

这是一个非常可接受的用户体验.

那么今天我现在必须等待十秒或更长时间才能获得识别结果.

我尝试过设置以下EXTRAS,其中没有一个会产生任何明显的区别

RecognizerIntent.EXTRA_SPEECH_INPUT_POSSIBLY_COMPLETE_SILENCE_LENGTH_MILLIS
RecognizerIntent.EXTRA_SPEECH_INPUT_COMPLETE_SILENCE_LENGTH_MILLIS
RecognizerIntent.EXTRA_SPEECH_INPUT_MINIMUM_LENGTH_MILLIS
Run Code Online (Sandbox Code Playgroud)

我一直在不断更改我的应用程序,但这些更改都与语音识别器无关.

我可以采用任何方法来缩短语音识别器切换onBeginningOfSpeech()到的时间onResults()吗?

这是一个需要多长时间的例子

07-01 17:50:20.839 24877-24877/com.voice I/Voice: onReadyForSpeech()
07-01 17:50:21.614 24877-24877/com.voice I/Voice: onBeginningOfSpeech()
07-01 17:50:38.163 24877-24877/com.voice I/Voice: onEndOfSpeech()
Run Code Online (Sandbox Code Playgroud)

android speech-recognition voice-recognition google-voice-search

27
推荐指数
2
解决办法
2万
查看次数

如何处理ERROR_RECOGNIZER_BUSY

在我的基于语音识别的应用程序中,我有时会收到ERROR_RECOGNIZER_BUSY.直觉上,这需要...... 重试,对吧?

问题是这个错误是非常无证的,所以很明显我有些问题可能是在该领域更有经验的人能够回答:

  1. 什么触发了这样的错误?它真的只是繁忙的服务器(在谷歌)?或者这也可以暗示我的应用程序中的错误?
  2. 在重试之前,我是否必须明确关闭/重新打开会话?
  3. 多久重试一次?每1秒一次?每5秒钟?其他?

我们非常欢迎您经验丰富的见解.谢谢.

android speech-recognition voice-recognition

25
推荐指数
1
解决办法
6282
查看次数

Google的语音识别技术是否有API?

我想尝试使用简单的语音命令(如"next"或"previous")创建jQuery幻灯片.有没有办法使用谷歌的语音识别?我知道Chrome的x-webkit-speech,但我必须单击一个按钮才能使用它.

我尝试了麻省理工学院的WAMI,但我发现它比谷歌的语音认知更慢,更准确.

javascript jquery speech-recognition google-api voice-recognition

22
推荐指数
2
解决办法
6万
查看次数

Python说话人识别

我有一个音频文件(录制的2人电话).我需要自动分离2个扬声器的声音.我是语音识别的新手,我看了python的wave模块但是找不到任何有用的信息.

请帮助如何开始.还请建议我免费的python库,它将帮助我解决问题.

python speech voice-recognition

20
推荐指数
2
解决办法
2万
查看次数

使用Windows语音识别,最小切断麦克风的音量

我正在使用Window的语音识别API,并且它一直在检测非常低的背景噪音作为"if"重复的单词.我一直试图找到一种方法来为它开始接受输入的最小量要求,但其所有成员都设置为只读.

如何设置麦克风音量的最小截止值?

编辑:找出一种获得平均值的方法,如果它低于我想要的平均值,则忽略文本

public void hRecognition_AudioStateChanged(object sender, AudioStateChangedEventArgs e)
    {
        if (e.AudioState == AudioState.Stopped)
        {
            volumeAverage /= volumeCount;
        }
        else if (e.AudioState == AudioState.Speech)
        {
            volumeAverage = 0;
            volumeCount = 0;
        }
    }

    public void hRecognition_AudioLevelUpdated(object sender, AudioLevelUpdatedEventArgs e)
    {
        volumeAverage += e.AudioLevel;
        volumeCount += 1;
    }
Run Code Online (Sandbox Code Playgroud)

c# voice-recognition

19
推荐指数
1
解决办法
838
查看次数