如何控制Android TTS播放音频的方式

mot*_*oku 14 android text-to-speech

我有一个使用Android TTS API将文本转录为音频的类.我可以控制音高和速度; 但我注意到引擎需要一个文本字符串和一个哈希对象.我注意到一些单词发音太快而不易被识别,并且拐点似乎太不自然了.有没有办法控制这两件事; 可能通过HashMap?以下是我如何使用引擎:

    mTts = new TextToSpeech(Globals.context, this); // context, listener
}

@Override
public void onInit(int status) {
    HashMap<String, String> myHashRender = new HashMap();
    myHashRender.put(TextToSpeech.Engine.KEY_PARAM_UTTERANCE_ID, speech);
    mTts.setPitch(0.8f);
    mTts.setSpeechRate(0.6f);
    mTts.synthesizeToFile(speech, myHashRender, fileOutPath);
    while (mTts.isSpeaking()) try {
        Thread.sleep(100);
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
    mTts.stop();
    mTts.shutdown();
Run Code Online (Sandbox Code Playgroud)

DKI*_*KIT 4

Google TTS 目前不支持这一点,但您可以执行以下操作:在解析文本期间,您可以更改其中的部分内容以获得所需的语调和音调变化。

例如,如果您遇到“Hey”一词,您可以将其即时重写为“Heeeey”,然后再将其发送到 TTS 引擎以获得不同的发音。

它并不漂亮,但它是一种解决方法。