标签: sapi

德尔福和SAPI

有没有人有资源从哪里学习使用Delphi的SAPI?

如何使用Delphi应用程序的语音识别?

谢谢.

delphi speech-recognition sapi

1
推荐指数
1
解决办法
3594
查看次数

使用 SAPI 创建个人语音识别系统

我正在使用此处给出的 C++ 代码。但这里使用的共享语音识别运行它自己的命令,例如移动、最小化、删除。我需要在不调用 MS 语音识别程序的情况下创建它。

hr = cpEngine.CoCreateInstance(CLSID_SpSharedRecognizer);
Run Code Online (Sandbox Code Playgroud)

上面的这一行创建共享实例。

我尝试使用CLSID_SpInprocRecognizer代替,但无法正确执行。我对此很陌生。有没有办法做到这一点?

windows shared sapi visual-c++ voice-recognition

1
推荐指数
1
解决办法
904
查看次数

SAPI5语音/使用32bit语音

在花了很多时间在网上搜索之后,我想是时候问了。

我正在尝试使用 C++ 中的 SAPI5 实现一些文本到语音。唯一可用的 64 位语音是 Anna。和安娜在一起一切都很好,但我还需要一个德国人的声音。所以我找到了 Hedda(微软)和 Steffi(Realspeak)。

我已经想实施一些约会服务。

Hedda 和 Steffi 均未添加到注册表中。因此,当 SAPI 检查“HKLM\SOFTWARE\Microsoft\Speech\Voices”以获取选择语音所需的令牌时,它们都不会被 SAPI 检测到。我还尝试将注册表路径更改为 ...\SOFTWARE\Wow6432Node... 以使用 32 位语音,但没有成功。

有人知道如何将 Hedda 或 Steffi 与 Sapi 一起使用吗?有没有办法使用32位语音?

希望任何人都可以提供帮助。提前致谢。

c++ sapi text-to-speech

1
推荐指数
1
解决办法
1664
查看次数

如何从C++ DLL中使用WndProc?

我想从DLL处理一些SAPI消息,这是一种插件.如何处理VC++ DLL中的消息/事件.SAPI事件处理显示在以下示例中:http: //msdn.microsoft.com/en-us/library/ms720165%28VS.85%29.aspx

c++ dll sapi wndproc

0
推荐指数
1
解决办法
2968
查看次数

使用 SAPI 或同等功能的 SR 将音频文件转换为文本

首先让我解释一下我的目标。我正在努力实现的目标是提供输入 .wav 文件,将其发送到某种语音识别 API,并返回带有转录的文本文件。我想到的应用程序非常简单。我不要求对其进行语法或标点符号解析。它可以返回一个又大又长的句子——这很好。我会将每个转录的单词视为文本文件(.tsv 或 .csv 格式)中的观察结果

然而,我确实需要的一个棘手的数据(棘手是因为我审查过的所有 3rd 方音频转录服务中 95% 不向用户提供此类数据)是 [0.00 - 1.00] 置信度得分SR 会对每个单词进行猜测。我想将该数据存储在文本文件的新列中,其中包含 .tsv 或 .csv 格式的转录文本。

就是这样。这就是我的目标。看来我的目标是可能的:这是相关帖子中专家的引用:

使用 SAPI 将音频(Wav 文件)转换为文本?

SAPI当然可以做你想做的事。从进程内识别器开始,将音频连接为文件流,设置听写模式,然后就可以开始了。

以下是 .wav 转录置信度分数的相关文档:

https://msdn.microsoft.com/en-us/library/jj127911.aspx

https://msdn.microsoft.com/en-us/library/microsoft.speech.recognition.recognizedwordunit.confidence(v=office.14).aspx

大家都说的很简单,现在我来解释一下问题;为什么我要发布问题。问题是,对我来说,我的目标遥不可及,因为我对 C++ 或 COM 几乎一无所知。我认为 SAPI 是日常 Windows 体验的一部分,并且有一个专用的、友好的用户界面。因此,我对这个程序研究得越多,就越感到震惊。但我仍然相信原则上这是一件非常简单的事情,所以我很乐观。

我有Python知识和一点JS知识。我知道 Python 对其他语言有代码魔力,所以我确信 Python 可以通过这种方式与 SAPI 交互,但由于我不懂 C++,我认为这不会让我过得更好。

所以重申一下,尽管技能不匹配,我仍然偏爱 SAPI,因为所有用户友好的替代方案,如 Dragon、Nuance、Chrome 插件等,都无法提供我需要的数据粒度。

现在让我谈谈我的问题的核心:

  1. 有人可以对我上述“目标”的难度进行评估吗?可以在单个 .bat 文件中完成吗?示例代码将不胜感激。

c++ com speech-recognition sapi

0
推荐指数
1
解决办法
1785
查看次数