适用于 Windows 的良好文本转语音解决方案

Jim*_*eth 9 audio windows windows-7 text-to-speech

我正在运行 Windows 7,我知道它能够在我的应用程序中读取文本,但我正在寻找一个很好的实用程序来将文本块保存为 wav 文件或 mp3。它可能已经内置到操作系统中,但被巧妙地伪装了起来。我知道我可以编写一个程序来调用 API,如果还没有好的解决方案,这是我的下一步。

我真的很喜欢AT&T 系统的质量,但它对使用生产的 MP3 有一些非常严格的限制。我想在我的播客中使用它们。

基于 Web 也可​​以,只要它可以轻松生成相当不受阻碍的(公共领域或知识共享)Wav、MP3 或其他一些标准音频文件。与商业相比,我自然更喜欢免费或开源,但这不是必需的。

Joh*_*n T 6

eSpeak是免费和开源的,并提供您需要的一切。

它可以作为命令行程序运行,从文件或标准输入中读出文本。
还提供共享库版本。

* 包括不同的音色,其特性可以改变。
* 可以将语音输出为 WAV 文件。
* 支持 SSML(语音合成标记语言)(不完整),
  还有 HTML。
* 紧凑的尺寸。该程序及其数据,包括多种语言,
  总共大约 1 MB。
* 可以将文本翻译成音素代码,因此可以改编为前台
  结束另一个语音合成引擎。
* 其他语言的潜力。有几个包含在不同的阶段
  的进展。这些或其他语言的母语人士的帮助是
  欢迎。
* 可用于生成和调整音素数据的开发工具。
* 用 C++ 编写。


Use*_*ser 4

我尝试过espeakFestivalMaryTTS。大多数情况下,它们都会生成可以理解的声音,但不是很自然。即使为这些系统(例如 Mbrola、CMU Arctic)提供额外的语音下载,语音也不是那么好。

IVONA 的声音是迄今为止我听过的最好的声音。他们为您提供 30 天的免费演示,如果您有一次性任务要做,这就足够了。之后他们的价格约为 45 美元/语音。亚马逊刚刚收购了该公司,因此您知道它很可靠(http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/)。

它们与 Microsoft 的 SAPI 接口配合使用,这意味着任何支持该接口的程序(例如 Adob​​e Reader)都可以使用语音。我一直将它们与Text To Wav程序一起使用,该程序非常适合将文本文件批量转换为波形文件。

编辑

实际上,只需重新阅读您的问题,我认为对于非个人用途(例如播客),IVONA 的价格可能要高得多。在这种情况下,我会建议查看 MaryTTS。