我正在使用此处给出的 C++ 代码。但这里使用的共享语音识别运行它自己的命令,例如移动、最小化、删除。我需要在不调用 MS 语音识别程序的情况下创建它。
hr = cpEngine.CoCreateInstance(CLSID_SpSharedRecognizer);
Run Code Online (Sandbox Code Playgroud)
上面的这一行创建共享实例。
我尝试使用CLSID_SpInprocRecognizer代替,但无法正确执行。我对此很陌生。有没有办法做到这一点?
有没有办法在Java中编写语音识别程序?
我知道有很多技术,我发现freetts看起来很舒服,虽然我成功地编写了一个文本到语音的程序,但没有找到任何语音识别参考.
在这件事上有没有人提到我?
提前致谢
我上周花了整整一个时间来搜索MFCC和相关问题.现在,我可以从二维矢量中的.wav文件中获得MFCC特征,coff [56] [12],让我们说.12是我想要提取的系数的数量,56是帧数.根据我读过的几个文件,我们可以使用12个以上的系数识别语音(特别是,我想识别单词"one","two"......到"ten").但是现在我得到了56个12个棺材,所以我应该使用56个框架中的哪一个?
如果我出错了,请帮帮我!
speech-recognition signal-processing fft voice-recognition mfcc
我正在为Google Glass编写游戏,但遗憾的是,在Google Glass GDK上的当前版本中无法使用SpeechRecognizer API.
所以我一直在考虑实现一种非常简单的语音识别算法.假设我只想承认:"是"和"否".
你知道任何示例代码或任何有用的资源来帮助我实现这个吗?
我是否应该放弃这个想法并使用像CMUSphinx这样的大框架?
如何识别:上,下,右,左或数字从1到10?
algorithm android speech-recognition voice-recognition google-glass
我已经阅读了一些关于语音/语音识别的内容,我想知道它是如何工作的。例如,Android 和类似情况下的“ok Google”?
我想知道它是如何工作的(如何区分和分析连续馈送中的单词,以找到它的关键字)。如果我认为它是一个连续的文本提要,一种方法是隔离给定长度的提要,然后找到一个关键字。音频提要有点难以理解,因为单词之间没有纯粹的沉默(如上所述)并且隔离给定的长度并不能保证在所选子提要的开头或结尾剪切关键字。它是如何工作的?
最后,如果你们知道一些能够做到这一点的库(如果可能的话,C/C++),我会很高兴实现一个“关键字检测器”。
谢谢你。
我正在尝试使用电子框架在 macOS 上创建通知。我已经从 GitHub 克隆了开源快速入门,我的 renderer.js 进程中的唯一代码如下:
var myNotification = new Notification('Electron Notification', {
'body':"test"
})
Run Code Online (Sandbox Code Playgroud)
没有通知。没有错误。没有什么。请帮忙!我努力了:
body:"test"
})
Run Code Online (Sandbox Code Playgroud)
诗。我还尝试使用 mdn 语音识别 api,当我在浏览器中启动时它工作得很好,但在电子中根本不起作用。为什么会这样。非常感谢
javascript push-notification voice-recognition html5-notifications electron
我有几个MP3文件是演讲.我之前使用过Android Speech to Text,所以我知道它可以存储口语.有什么方法可以从MP3中获取所说的单词并将其显示在一个EditText?
我正在考虑默默地播放MP3并识别单词,但不知道如何做到这一点.我正在使用Google Speech Engine.
我正在寻找语音识别在Ionic2与科尔多瓦框架插件.
如果可以实现,你可以轻轻提供一个代码示例(.html和.ts)吗?
我找到了这个,但是对于Ionic1:http://devgirl.org/2016/01/08/speaking-with-cordova/ 我无法调整Ionic2的代码.
我非常感谢你能提供的任何帮助,对不起我的小英语.