Hel*_*his 8 text-to-speech google-text-to-speech
我已经尝试了一段时间让语音或音素发音与谷歌的文本到语音一起使用,但未能使其始终如一地执行。
\n\n我通过使用https://tophonetics.com/获得了有限的结果\n它翻译为“牛发疯了”。到“\xc3\xb0\xc9\x99 ka\xca\x8a w\xc9\x9bnt m\xc3\xa6d”。但听不到\'\'\'\xc3\xb0\xc9\x99\'\n的声音。当我尝试“\xc3\xb0\xc9\xaas \xc9\xaaz s\xc9\x99m f\xc9\x99\xcb\x88n\xc9\x9bt\xc9\xaak t\xc9\x9bkst \xcb\x88\xc9 \xaan\xcb\x8cp\xca\x8at"。
\n\n是否有任何 SSML 代码来定义文本的语音块,\n可以采用以下格式“D,Is Iz sVm f@n\'EtIk t\'Ekst \'InpUt”\n可以代替“\xc3\xb0\” xc9\xaas\xc9\xaaz s\xc9\x99m f\xc9\x99\xcb\x88n\xc9\x9bt\xc9\xaak t\xc9\x9bkst\xcb\x88\xc9\xaan\xcb\x8cp\xca\x8at “\n”
\nSSML 标签可以满足<phoneme>您的目的。
不幸的是,Google Cloud 文本转语音目前不支持它。文档中列出了 Google Cloud 的可用 SSML 标签子集。该<phoneme>标签不在此列表中。使用 Google Cloud 的文本转语音演示进行的实验证实了音素被忽略。标签的内容被作为普通文本读取,正如 @Trevor 在评论中已经指出的那样。
不过,该<phoneme>标签受到 Microsoft Azure 文本转语音和 Amazon Polly 的支持。在这两种情况下,可用的音素都仅限于正在使用的语言中可用的音素(有关 Azure 的信息请参见此处,有关 Polly 的信息请参见此处)。Azure 文档并未 100% 明确排除语言外音素,但Azure 文本转语音演示的实际实验证实它们无法正常工作。在某些情况下,它们至少似乎被所用语言中最接近的可用等效项所取代。
仅限于一种语言的音素严重限制了音素标签的有用性。例如,您无法使用该功能在第二语言中嵌入正确发音的内容,因为第二语言通常具有一些第一语言中不可用的音素。具体语言对中,每种语言都有一些另一种语言中没有的音素,包括英语/德语、西班牙语/德语、英语/西班牙语。