在.NET中有两个类似的名称空间和程序集用于语音识别.我试图了解这些差异以及何时适合使用其中一种.
从程序集System.Speech(在System.Speech.dll中)有System.Speech.Recognition.System.Speech.dll是.NET Framework类库3.0及更高版本中的核心DLL
还有Microsoft.Speech.Recognition来自程序集Microsoft.Speech(在microsoft.speech.dll中).Microsoft.Speech.dll是UCMA 2.0 SDK的一部分
我发现文档令人困惑,我有以下问题:
System.Speech.Recognition表示它适用于"Windows桌面语音技术",这是否意味着它不能用于服务器操作系统或不能用于大规模应用程序?
UCMA 2.0 Speech SDK(http://msdn.microsoft.com/en-us/library/dd266409%28v=office.13%29.aspx)表示它需要Microsoft Office Communications Server 2007 R2作为先决条件.但是,我在会议和会议上被告知,如果我不需要存在和工作流等OCS功能,我可以使用没有OCS的UCMA 2.0 Speech API.这是真的?
如果我正在为服务器应用程序构建一个简单的识别应用程序(假设我想自动转录语音邮件)而且我不需要OCS的功能,那么两个API之间有什么区别?
我正在开发一个网站,我想帮助盲人通过语音使用它,所以我将使用:
我已经有了一些文本到语音的JavaScript库(比如speak.js),但现在我需要一个很好的语音到文本.有一些解决方案用于此目的(如speechapi),但他们使用Java Applets或Flash,我想只依赖JavaScript,以避免插件.
我正在尝试使用x-webkit-speech和Google Chrome进行HTML5的语音输入,这很好,但你需要点击一个图标(盲人不能很好地使用鼠标).使用x-webkit-speech按键是否可行?你知道任何替代API(JavaScript)吗?
谢谢!
javascript html5 speech-recognition google-chrome speech-to-text
我希望创建一个具有语音到文本的应用程序.
我使用RecognizerIntent了解这种能力:http://android-developers.blogspot.com/search/label/Speech%20Input
但是 - 我不希望弹出一个新的Intent,我想在我当前的应用程序中对某些点进行分析,我不希望它弹出一些声明它正在尝试录制你的声音.
有没有人知道如何最好地做到这一点.我或许正在考虑尝试Sphinx 4 - 但我不知道这是否可以在Android上运行 - 有没有人有任何建议或经验?!
我想知道我是否可以在这里更改代码,可能不会打扰显示UI或按钮,只是进行处理:http://developer.android.com/resources/samples/ApiDemos/src/com/example/android/的API /应用程序/ VoiceRecognition.html
干杯,
有人知道已经托管的任何好的服务器端语音识别引擎吗?即我希望能够调用一个简单的Web API发布一些声音数据并获取文本.不必是免费的 - 但希望可以免费试用.