提高 Pico2Wave 文本转语音的声音（而非语音）质量

Question

提高 Pico2Wave 文本转语音的声音（而非语音）质量

Tul*_*ova 1 sound text-to-speech

我使用 Ubuntu 12.04。

我想广泛使用 Linux 的文本到语音转换功能来从文本创建音频文件。

我试过 Festival，但找到好的声音并安装它们过于复杂，所以我使用它的默认声音。

我也试过 Pico2Wave。

节日文本到语音完全是机器人和不自然的，不适合长期收听。它在背景中有“呼呼”的声音，但您仍然可以清晰地听到这些词，但同样，就语音而言，机器人和质量很差。

节日样品在这里

Pico2Wave 非常自然，在措辞和类似人类的语音方面可与 Apple 的文本到语音相媲美，但声音本身的质量很糟糕。听起来好像是在一个非常空旷的房间里录制的，回声很大。听起来“闷”，浑浊，粗大，低音太多。它使扬声器发出嘎嘎声，有时很难理解，除非您使用耳机。声音根本不是噼啪声。我也怀疑声音“剪辑”，但我不是音频专家。

Pico2Wave 示例在这里

我的问题是：

如何提高生成的音频文件的音质？我不是音频专家，所以我不知道我必须摆弄什么（增益？，低音？，降低噪音？到什么程度？等）请注意，我不是在要求推荐的工具，而是要解释了该音频究竟有什么问题，以及我应该在我选择的音频编辑/改进应用程序中摆弄哪些品质。

注意：示例文本是“最后的莫希干人”的第一段：

北美洲殖民战争的一个特点是，在敌对的东道主相遇之前，就必须经历荒野的艰辛和危险。宽阔且明显不透水的森林边界切断了敌对的法国和英国省份的领土。顽强的殖民者和训练有素的欧洲人与他并肩作战，经常花费数月时间与湍急的溪流或崎岖的山脉作斗争，以寻求机会在更加军事化的冲突中展示他们的勇气. 但是，他们效仿训练有素的本土战士的耐心和克己精神，学会了克服一切困难；似乎，随着时间的流逝，树林的深处再也没有如此黑暗的地方，也没有任何秘密的地方如此可爱，

Answer 1

小智 5

我只是遇到了同样的问题，目前我以类似的方式结束

pico2wave -l $LANGUAGE -w $WAV "$*" && play -qV0 $WAV treble 24 gain -l 6

Run Code Online (Sandbox Code Playgroud)

这听起来更“脆”。

归档时间：	8 年，11 月前
查看次数：	5167 次
最近记录：	8 年，7 月前