标签: speech

如果没有Android手机中烦人的对话框,我怎么能使用语音识别

这可能没有修改android API吗?我发现了一篇关于此的文章.有一条评论我应该对android API进行修改.但它没有说明如何进行修改.谁能给我一些关于如何做到这一点的建议?谢谢!


我找到了这篇文章; SpeechRecognizer 他的需求与我的几乎相同.这对我来说是一个很好的参考!


我完全解决了这个问题.
从这个中国网站上搜索了一个可用的示例代码.这 是我的源代码

package voice.recognition.test;

import android.app.Activity;
import android.content.Intent;
import android.os.Bundle;
import android.view.View;
import android.view.View.OnClickListener;
import android.speech.RecognitionListener;
import android.speech.RecognizerIntent;
import android.speech.SpeechRecognizer;
import android.widget.Button;
import android.widget.TextView;
import java.util.ArrayList;
import android.util.Log;



public class voiceRecognitionTest extends Activity implements OnClickListener 
{

   private TextView mText;
   private SpeechRecognizer sr;
   private static final String TAG = "MyStt3Activity";
   @Override
   public void onCreate(Bundle savedInstanceState) 
   {
            super.onCreate(savedInstanceState);
            setContentView(R.layout.main);
            Button speakButton = (Button) findViewById(R.id.btn_speak);     
            mText = (TextView) findViewById(R.id.textView1);     
            speakButton.setOnClickListener(this);
            sr = SpeechRecognizer.createSpeechRecognizer(this); …
Run Code Online (Sandbox Code Playgroud)

android speech-recognition speech

121
推荐指数
4
解决办法
7万
查看次数

System.Speech.Recognition和Microsoft.Speech.Recognition有什么区别?

在.NET中有两个类似的名称空间和程序集用于语音识别.我试图了解这些差异以及何时适合使用其中一种.

从程序集System.Speech(在System.Speech.dll中)有System.Speech.Recognition.System.Speech.dll是.NET Framework类库3.0及更高版本中的核心DLL

还有Microsoft.Speech.Recognition来自程序集Microsoft.Speech(在microsoft.speech.dll中).Microsoft.Speech.dll是UCMA 2.0 SDK的一部分

我发现文档令人困惑,我有以下问题:

System.Speech.Recognition表示它适用于"Windows桌面语音技术",这是否意味着它不能用于服务器操作系统或不能用于大规模应用程序?

UCMA 2.0 Speech SDK(http://msdn.microsoft.com/en-us/library/dd266409%28v=office.13%29.aspx)表示它需要Microsoft Office Communications Server 2007 R2作为先决条件.但是,我在会议和会议上被告知,如果我不需要存在和工作流等OCS功能,我可以使用没有OCS的UCMA 2.0 Speech API.这是真的?

如果我正在为服务器应用程序构建一个简单的识别应用程序(假设我想自动转录语音邮件)而且我不需要OCS的功能,那么两个API之间有什么区别?

.net speech-recognition speech ucs ucma2.0

78
推荐指数
4
解决办法
4万
查看次数

面向开发人员的语音识别软件

那些文档终于说出来了,我需要在我的手腕上放几个月.因为我是一名.NET开发人员,这可能会暂时维持生计,这是我不急于做的事情.那就是说,开发人员有没有好的免提选择?有没有人成功使用任何语音识别软件?

POSTSCRIPT:我已经恢复了我的手臂,直到双手编程不成问题.Dragon自然而然地说效果不错,但速度较慢,而不像我编程的键盘比我想象的要快.

ergonomics voice speech-recognition speech code-by-voice

47
推荐指数
5
解决办法
2万
查看次数

良好的语音识别API

我正在开展一个大学项目,我正在使用语音识别.目前我正在Windows 7上开发它,我正在使用与.net一起提供的system.speech API包,我正在C#上进行.

我面临的问题是听写识别不够准确.然后每当我启动应用程序时,桌面语音识别都会自动启动.这对我来说是一个很大的麻烦.正如我所说的话已经不够清楚,并且冲突的识别被解释为正在执行诸如应用程序切换最小化之类的命令和动作.

这是我的应用程序的一个关键部分,我恳请你为我提出任何好的语音API,除了这个微软的错误.即使它只能理解简单的听写语法也会很好.

.net c# speech-recognition speech speech-to-text

26
推荐指数
1
解决办法
7万
查看次数

用于检测人类语音,性别,年龄和情绪的音频分析 - 任何先前的开源工作都已完成?

是否在"音频分析"领域进行了先前的开源工作以检测人声(即尽管有一些背景噪声),确定说话者的性别,可能确定不.发言者,发言者的年龄和发言者的情绪?

我的预感是像CMU Sphinx这样的语音识别软件可能是一个很好的起点,但如果有更好的东西,它会很棒.

speech-recognition analysis speech emotion

24
推荐指数
1
解决办法
2万
查看次数

用于语音检测和鉴别的开源代码

我有15个录音带,其中一个我认为包含了我祖母和我自己说话的旧录音.寻找合适地点的快速尝试并未将其提升.我不想听20个小时的磁带来找到它.该位置可能不在其中一个磁带的开头.大多数内容似乎分为三类 - 按总长度排列,最长的是:静音,语音广播和音乐.

我计划将所有磁带转换为数字格式,然后再次查看录制内容.显而易见的方法是在我做其他事情时在后台播放它们.这对我来说太简单了,所以:是否有任何开源库或其他代码可以让我找到,以便提高复杂性和实用性:

  1. 非沉默区域
  2. 包含人类语音的区域
  3. 包含我自己演讲的地区(和我祖母的演讲)

我更喜欢Python,Java或C.

由于我对该领域一无所知,因此未能得到答案,关于搜索词的提示将受到赞赏.

据我所知,我可以轻松地花20多个小时.

speech-recognition speech

24
推荐指数
4
解决办法
3万
查看次数

在python中的单词上拆分语音音频文件

我觉得这是一个相当普遍的问题,但我还没有找到合适的答案.我有许多人类语音的音频文件,我想在单词上打破,这可以通过查看波形中的暂停来启发式地完成,但是有人能指向我自动执行此操作的python中的函数/库吗?

python audio speech-recognition heuristics speech

23
推荐指数
1
解决办法
2万
查看次数

Python说话人识别

我有一个音频文件(录制的2人电话).我需要自动分离2个扬声器的声音.我是语音识别的新手,我看了python的wave模块但是找不到任何有用的信息.

请帮助如何开始.还请建议我免费的python库,它将帮助我解决问题.

python speech voice-recognition

20
推荐指数
2
解决办法
2万
查看次数

如何在C#中改变语音合成器的性别和年龄?

我想改变System.Speechc#中声音的性别和年龄.例如,一个10年的女孩却找不到任何简单的例子来帮助我调整参数.

c# synthesizer speech

20
推荐指数
2
解决办法
5万
查看次数

如何在javascript中捕获音频?

我目前正在使用getUserMedia(),仅适用于Firefox和Chrome,但它已被弃用,仅适用于https(在Chrome中).有没有其他/更好的方法来获得适用于所有平台的javascript中的语音输入?

例如,像web.whatsapp.com app这样的网站如何录制音频?getUserMedia()提示第一次用户允许录音,而Whatsapp应用程序不需要用户的许可.

getUserMedia()我目前正在使用这个样子的:

navigator.getUserMedia(
    {
        "audio": {
            "mandatory": {
                "googEchoCancellation": "false",
                "googAutoGainControl": "false",
                "googNoiseSuppression": "false",
                "googHighpassFilter": "false"
            },
            "optional": []
        },
    }, gotStream, function(e) {
        console.log(e);
    });
Run Code Online (Sandbox Code Playgroud)

javascript audio speech voice-recording getusermedia

20
推荐指数
2
解决办法
2万
查看次数