在.NET中有两个类似的名称空间和程序集用于语音识别.我试图了解这些差异以及何时适合使用其中一种.
从程序集System.Speech(在System.Speech.dll中)有System.Speech.Recognition.System.Speech.dll是.NET Framework类库3.0及更高版本中的核心DLL
还有Microsoft.Speech.Recognition来自程序集Microsoft.Speech(在microsoft.speech.dll中).Microsoft.Speech.dll是UCMA 2.0 SDK的一部分
我发现文档令人困惑,我有以下问题:
System.Speech.Recognition表示它适用于"Windows桌面语音技术",这是否意味着它不能用于服务器操作系统或不能用于大规模应用程序?
UCMA 2.0 Speech SDK(http://msdn.microsoft.com/en-us/library/dd266409%28v=office.13%29.aspx)表示它需要Microsoft Office Communications Server 2007 R2作为先决条件.但是,我在会议和会议上被告知,如果我不需要存在和工作流等OCS功能,我可以使用没有OCS的UCMA 2.0 Speech API.这是真的?
如果我正在为服务器应用程序构建一个简单的识别应用程序(假设我想自动转录语音邮件)而且我不需要OCS的功能,那么两个API之间有什么区别?
我现在正在处理我的项目,我即将为桌面计算机构建类似Siri的应用程序.我在想Google Speech API是否可靠且准确地用于语音识别?您能否向我推荐一下语音识别最准确的语音API?最优选的是免费的API.谢谢.
是否有任何众所周知的C或Java或PHP建立的框架来进行语音识别应用程序?麦克风音频输入,它将识别英语单词.比如伪代码:
Speech s = new Speech();
s.input(micStream);
result = s.recognise("Hello");
if (result) { printf("Matched hello"); } else { printf("No match found"); }
Run Code Online (Sandbox Code Playgroud)
跟进:

添加库
复制并粘贴代码:
a)放在某处的xml文件,可以从代码中加载:
https://gist.github.com/2551321
b)使用这个:
package edu.cmu.sphinx.demo.hellowrld;
import edu.cmu.sphinx.frontend.util.Microphone;
import edu.cmu.sphinx.recognizer.Recognizer;
import edu.cmu.sphinx.result.Result;
import edu.cmu.sphinx.util.props.ConfigurationManager;
import java.io.IOException;
import java.util.logging.Level;
import java.util.logging.Logger;
import models.Tts;
public class Speech {
public static void main(String[] args) {
ConfigurationManager cm;
if (args.length > 0) {
cm = new ConfigurationManager(args[0]);
} else {
///tmp/helloworld.config.xml
cm = new ConfigurationManager(Speech.class.getResource("speech.config.xml"));
}
Recognizer …Run Code Online (Sandbox Code Playgroud)我打算为Linux编写一个使用文本到语音和语音识别的程序.有什么最好的工具/库?我应该使用Windows代替能够使用更好的工具吗?这些工具需要可以从控制台或C程序轻松调用.
我正在寻找PHP语音识别.
我有很多wav文件(10-15秒),我希望语音识别能够识别每个wav文件中的1或2个单词,然后将其标记为数据库或csv.
所有文件都有相同的声音和口音(同一个人哈哈)
示例伪代码:
$voice = new play('file.wav');
$result = $voice->recognise("Good Morning");
if ($result) {
echo "Matched Good Morning";
//flag to database or csv
} else {
echo "No match found";
}
Run Code Online (Sandbox Code Playgroud)
哪个PHP语音识别库可以做到这一点?
什么文本语音和语音识别库可用于Clojure?到目前为止我发现了
https://github.com/klutometis/speech-recognition
https://github.com/klutometis/speech-synthesis
这两者都使用谷歌,因此依赖于网络.
我正在寻找那些不依赖互联网工作的人
speech-recognition clojure text-to-speech speech-synthesis libraries
我想使用pyspeech API转录mp3(语音到文本).不过,我不知道这是否可行.
是吗?怎么样?
我正在使用java开发桌面应用程序.这个应用程序是为学校的孩子教英语,用户可以上传一些英语音频可以是任何格式,需要转换成文本文件.他们可以在哪里阅读文字.
我发现了一些api,但我不确定它们.
http://cmusphinx.sourceforge.net/wiki/
我在stackoverflow上看到了很多关于这个的问题,但没有一个是有帮助的.如果有人可以帮助,这将是非常伟大的
谢谢
在大多数Android手机中,有一个选项可以指示文本而不是输入文本.是否可以使用URL单独访问此服务?例如,我将录制的语音发送到此服务,然后它给我文本输出.可能吗?你能告诉我吗?
什么是当前支持的最佳语音或文本API或移动SDK(多个平台:Android,iOS等)
有一些特别针对iPhone的帖子,但我正在寻找一种理想的跨平台解决方案.
NB似乎所有解决方案最终都发布到远程服务器上的REST-ful API,而不是在本地进行语音处理.(这是真的?)