Tul*_*ova 1 sound text-to-speech
我使用 Ubuntu 12.04。
我想广泛使用 Linux 的文本到语音转换功能来从文本创建音频文件。
我试过 Festival,但找到好的声音并安装它们过于复杂,所以我使用它的默认声音。
我也试过 Pico2Wave。
节日文本到语音完全是机器人和不自然的,不适合长期收听。它在背景中有“呼呼”的声音,但您仍然可以清晰地听到这些词,但同样,就语音而言,机器人和质量很差。
Pico2Wave 非常自然,在措辞和类似人类的语音方面可与 Apple 的文本到语音相媲美,但声音本身的质量很糟糕。听起来好像是在一个非常空旷的房间里录制的,回声很大。听起来“闷”,浑浊,粗大,低音太多。它使扬声器发出嘎嘎声,有时很难理解,除非您使用耳机。声音根本不是噼啪声。我也怀疑声音“剪辑”,但我不是音频专家。
我的问题是:
如何提高生成的音频文件的音质?我不是音频专家,所以我不知道我必须摆弄什么(增益?,低音?,降低噪音?到什么程度?等)请注意,我不是在要求推荐的工具,而是要解释了该音频究竟有什么问题,以及我应该在我选择的音频编辑/改进应用程序中摆弄哪些品质。
注意:示例文本是“最后的莫希干人”的第一段:
北美洲殖民战争的一个特点是,在敌对的东道主相遇之前,就必须经历荒野的艰辛和危险。宽阔且明显不透水的森林边界切断了敌对的法国和英国省份的领土。顽强的殖民者和训练有素的欧洲人与他并肩作战,经常花费数月时间与湍急的溪流或崎岖的山脉作斗争,以寻求机会在更加军事化的冲突中展示他们的勇气. 但是,他们效仿训练有素的本土战士的耐心和克己精神,学会了克服一切困难;似乎,随着时间的流逝,树林的深处再也没有如此黑暗的地方,也没有任何秘密的地方如此可爱,
小智 5
我只是遇到了同样的问题,目前我以类似的方式结束
pico2wave -l $LANGUAGE -w $WAV "$*" && play -qV0 $WAV treble 24 gain -l 6
Run Code Online (Sandbox Code Playgroud)
这听起来更“脆”。