Jim*_*eth 9 audio windows windows-7 text-to-speech
我正在运行 Windows 7,我知道它能够在我的应用程序中读取文本,但我正在寻找一个很好的实用程序来将文本块保存为 wav 文件或 mp3。它可能已经内置到操作系统中,但被巧妙地伪装了起来。我知道我可以编写一个程序来调用 API,如果还没有好的解决方案,这是我的下一步。
我真的很喜欢AT&T 系统的质量,但它对使用生产的 MP3 有一些非常严格的限制。我想在我的播客中使用它们。
基于 Web 也可以,只要它可以轻松生成相当不受阻碍的(公共领域或知识共享)Wav、MP3 或其他一些标准音频文件。与商业相比,我自然更喜欢免费或开源,但这不是必需的。
eSpeak是免费和开源的,并提供您需要的一切。
它可以作为命令行程序运行,从文件或标准输入中读出文本。 还提供共享库版本。 * 包括不同的音色,其特性可以改变。 * 可以将语音输出为 WAV 文件。 * 支持 SSML(语音合成标记语言)(不完整), 还有 HTML。 * 紧凑的尺寸。该程序及其数据,包括多种语言, 总共大约 1 MB。 * 可以将文本翻译成音素代码,因此可以改编为前台 结束另一个语音合成引擎。 * 其他语言的潜力。有几个包含在不同的阶段 的进展。这些或其他语言的母语人士的帮助是 欢迎。 * 可用于生成和调整音素数据的开发工具。 * 用 C++ 编写。
我尝试过espeak、Festival和MaryTTS。大多数情况下,它们都会生成可以理解的声音,但不是很自然。即使为这些系统(例如 Mbrola、CMU Arctic)提供额外的语音下载,语音也不是那么好。
IVONA 的声音是迄今为止我听过的最好的声音。他们为您提供 30 天的免费演示,如果您有一次性任务要做,这就足够了。之后他们的价格约为 45 美元/语音。亚马逊刚刚收购了该公司,因此您知道它很可靠(http://www.ivona.com/us/news/amazoncom-announces-acquisition-of-ivona-software/)。
它们与 Microsoft 的 SAPI 接口配合使用,这意味着任何支持该接口的程序(例如 Adobe Reader)都可以使用语音。我一直将它们与Text To Wav程序一起使用,该程序非常适合将文本文件批量转换为波形文件。
编辑
实际上,只需重新阅读您的问题,我认为对于非个人用途(例如播客),IVONA 的价格可能要高得多。在这种情况下,我会建议查看 MaryTTS。
归档时间: |
|
查看次数: |
4200 次 |
最近记录: |