有没有人有资源从哪里学习使用Delphi的SAPI?
如何使用Delphi应用程序的语音识别?
谢谢.
我正在使用此处给出的 C++ 代码。但这里使用的共享语音识别运行它自己的命令,例如移动、最小化、删除。我需要在不调用 MS 语音识别程序的情况下创建它。
hr = cpEngine.CoCreateInstance(CLSID_SpSharedRecognizer);
Run Code Online (Sandbox Code Playgroud)
上面的这一行创建共享实例。
我尝试使用CLSID_SpInprocRecognizer代替,但无法正确执行。我对此很陌生。有没有办法做到这一点?
在花了很多时间在网上搜索之后,我想是时候问了。
我正在尝试使用 C++ 中的 SAPI5 实现一些文本到语音。唯一可用的 64 位语音是 Anna。和安娜在一起一切都很好,但我还需要一个德国人的声音。所以我找到了 Hedda(微软)和 Steffi(Realspeak)。
我已经想实施一些约会服务。
Hedda 和 Steffi 均未添加到注册表中。因此,当 SAPI 检查“HKLM\SOFTWARE\Microsoft\Speech\Voices”以获取选择语音所需的令牌时,它们都不会被 SAPI 检测到。我还尝试将注册表路径更改为 ...\SOFTWARE\Wow6432Node... 以使用 32 位语音,但没有成功。
有人知道如何将 Hedda 或 Steffi 与 Sapi 一起使用吗?有没有办法使用32位语音?
希望任何人都可以提供帮助。提前致谢。
我想从DLL处理一些SAPI消息,这是一种插件.如何处理VC++ DLL中的消息/事件.SAPI事件处理显示在以下示例中:http: //msdn.microsoft.com/en-us/library/ms720165%28VS.85%29.aspx
首先让我解释一下我的目标。我正在努力实现的目标是提供输入 .wav 文件,将其发送到某种语音识别 API,并返回带有转录的文本文件。我想到的应用程序非常简单。我不要求对其进行语法或标点符号解析。它可以返回一个又大又长的句子——这很好。我会将每个转录的单词视为文本文件(.tsv 或 .csv 格式)中的观察结果
然而,我确实需要的一个棘手的数据(棘手是因为我审查过的所有 3rd 方音频转录服务中 95% 不向用户提供此类数据)是 [0.00 - 1.00] 置信度得分SR 会对每个单词进行猜测。我想将该数据存储在文本文件的新列中,其中包含 .tsv 或 .csv 格式的转录文本。
就是这样。这就是我的目标。看来我的目标是可能的:这是相关帖子中专家的引用:
SAPI当然可以做你想做的事。从进程内识别器开始,将音频连接为文件流,设置听写模式,然后就可以开始了。
以下是 .wav 转录置信度分数的相关文档:
https://msdn.microsoft.com/en-us/library/jj127911.aspx
大家都说的很简单,现在我来解释一下问题;为什么我要发布问题。问题是,对我来说,我的目标遥不可及,因为我对 C++ 或 COM 几乎一无所知。我认为 SAPI 是日常 Windows 体验的一部分,并且有一个专用的、友好的用户界面。因此,我对这个程序研究得越多,就越感到震惊。但我仍然相信原则上这是一件非常简单的事情,所以我很乐观。
我有Python知识和一点JS知识。我知道 Python 对其他语言有代码魔力,所以我确信 Python 可以通过这种方式与 SAPI 交互,但由于我不懂 C++,我认为这不会让我过得更好。
所以重申一下,尽管技能不匹配,我仍然偏爱 SAPI,因为所有用户友好的替代方案,如 Dragon、Nuance、Chrome 插件等,都无法提供我需要的数据粒度。
现在让我谈谈我的问题的核心: