标签: voice-recognition

// This is a demonstration of Android's built in speech recognizer

package com.example.voiceinputbuiltintest;

import java.util.ArrayList;
import java.util.Locale;

import android.os.Bundle;
import android.app.Activity;
import android.content.Intent;
import android.speech.RecognizerIntent;
import android.view.Menu;
import android.view.View;
import android.widget.Button;
import android.widget.TextView;
import android.widget.Toast;

public class MainActivity extends Activity {

    private static final int VOICE_RECOGNITION = 1;
    Button speakButton ;
    TextView spokenWords; 

    @Override
    protected void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_main);
        speakButton = (Button) findViewById(R.id.button1);  
        spokenWords = (TextView)findViewById(R.id.textView1);
    }

    @Override
    public boolean onCreateOptionsMenu(Menu menu) {
        // Inflate the menu; …

Run Code Online (Sandbox Code Playgroud)

android voice-recognition

use*_*267

2013 10-24

5
推荐指数

1
解决办法

1万
查看次数

我正在尝试使用Javascript中提供的新VoiceRecognitionAPI(由chrome支持).在我正在尝试开发的应用程序中,我需要一些非常确定的单词,主要是数字...不言而喻,VoiceRecognition不能顺利运行,并且不会一直得到正确的单词,主要是像4这样的数字变成"对于"或3成为"三个"等我知道有一些关于为VoiceRecognition提供语法的选项,这将提高识别率,但它尚未得到支持,不会很快...

是否有任何改进语音识别的方法,特别是在一个内容非常少的应用程序中？

html javascript voice-recognition

byt*_*yer

lucky-day

5
推荐指数

1
解决办法

370
查看次数

在Android应用程序中始终在听的语音识别

我正在尝试为我的应用程序添加一些语音识别,这种语音识别始终在聆听(就像服务一样).我希望它在识别某些说出的单词时执行不同的操作,即:"总时间","最大速度"等会触发在我的应用程序中执行某些操作的事件.

到目前为止,我只能找到将语音识别添加到活动中.我可以把这个活动放在应用程序活动的顶部,但我宁愿不这样做.而且,我不确定它是否总是会听我想要的.我不想按下按钮来关闭语音识别监听器.我希望能够将手机放在口袋里,通过耳机上的麦克风讲话,让它按照我说的做.我不得不说"Ok Google"这样的东西让它开始听命令,但是如果它已经在听它了,我不能只是听它的应用命令吗？

android voice-recognition android-intent

Chr*_*son

2014 05-09

5
推荐指数

0
解决办法

9371
查看次数

Cortana帮助列表需要什么图标？

所以我在我的应用程序中添加了Cortana的语音命令识别功能.我的VCD文件已全部设置完毕,所有内容都按预期工作,所以现在我必须找一些小东西.

我在我的应用程序中拥有所有需要的图标(我知道),但当我的应用程序出现在Cortana屏幕上时("我能说什么？"屏幕),我的应用程序显示为默认图标,而不是我添加的.

所以我的问题是,我没有看到什么是缺少的图标？

在此输入图像描述

ps:官方远程桌面应用程序也显示相同的图标,所以我想我不是唯一一个缺少图标:)

voice-recognition windows-phone windows-phone-8.1 cortana

seb*_*mez

lucky-day

5
推荐指数

1
解决办法

190
查看次数

从Android Wearable获取语音输入

目前,Google Hangouts和Facebook Messenger等应用程序可以接受来自Android Wearables的语音输入,将其翻译为文本并向用户发送回复消息.我已经按照https://developer.android.com/training/wearables/notifications/voice-input.html上的教程进行操作,当我调用那里概述的方法时:

private CharSequence getMessageText(Intent intent) {
    Bundle remoteInput = RemoteInput.getResultsFromIntent(intent);
        if (remoteInput != null) {
            return remoteInput.getCharSequence(EXTRA_VOICE_REPLY);
        }
    }
    return null;
}

Run Code Online (Sandbox Code Playgroud)

我收到RemoteInput.getResultsFromIntent(intent)行的错误,指出我的API级别太低.目前使用三星Galaxy S3,4.4.2 API 19.显然,这种方法对我来说无法访问,所以我的问题是,环聊和Facebook Messenger等应用程序如何接受语音输入并将输入信息输入到我的设备上？

android voice-recognition wear-os

And*_*oid

lucky-day

5
推荐指数

1
解决办法

1051
查看次数

谷歌云演讲:区分声音？

我有兴趣编写一个能够识别多个发言者的语音识别应用程序.例如,如果比尔,乔和简正在谈论,那么应用程序不仅可以将声音识别为文本,还可以通过发言者对结果进行分类(比如0,1和2 ......因为显然/希望谷歌没有办法将声音链接到人).

我正在寻找可能会这样做的语音识别API,而Google Cloud Speech则是排名第一的API.我查看了API文档,看看这些功能是否可用,还没有找到.

我的问题是:这个功能是否存在？

注意:Google的支持页面说他们的工程师有时会在SO上回答这些问题,所以似乎有人可能会回答问题的"遗嘱"部分.

speech-recognition voice-recognition google-cloud-speech

作者

2017 02-02

5
推荐指数

2
解决办法

6255
查看次数

如何使用python将对数概率转换为0到1之间的简单概率

我正在使用高斯混合模型进行说话人识别。我使用此代码来预测每个语音剪辑的说话者。

for path in file_paths:   
path = path.strip()   
print (path)
sr,audio = read(source + path)
vector   = extract_features(audio,sr)
#print(vector)
log_likelihood = np.zeros(len(models))
#print(len(log_likelihood))
for i in range(len(models)):
    gmm1   = models[i]  #checking with each model one by one
    #print(gmm1)
    scores = np.array(gmm1.score(vector)) 
    #print(scores)
    #print(len(scores))
    log_likelihood[i] = scores.sum()
    print(log_likelihood)
    winner = np.argmax(log_likelihood)
    #print(winner)
print ("\tdetected as - ", speakers[winner])

Run Code Online (Sandbox Code Playgroud)

它给了我这样的输出：

[ 311.79769716    0.            0.            0.            0.        ]
[  311.79769716 -5692.56559902     0.             0.             0.        ]
[  311.79769716 -5692.56559902 -6170.21460788     0.             0.        ]
[ …

Run Code Online (Sandbox Code Playgroud)

python speech-recognition gaussian voice-recognition gmm

San*_*eep

2019 10-24

5
推荐指数

1
解决办法

3668
查看次数