小编Jam*_*mes的帖子

如何从 Google Cloud text-to-speech API 获取 SSML <mark> 时间戳

我想通过 Google Cloud text-to-speech API使用SSML 标记来请求音频流中这些标记的时间。这些时间戳是必要的，以便为用户提供效果提示、单词/部分突出显示和反馈。

我发现这个问题是相关的，尽管这个问题是指每个单词的时间戳而不是 SSML<mark>标签。

以下 API 请求返回 OK，但显示缺少请求的标记数据。这是使用Cloud Text-to-Speech API v1.

{
 "voice": {
  "languageCode": "en-US"
 },
 "input": {
  "ssml": "<speak>First, <mark name=\"a\"/> second, <mark name=\"b\"/> third.</speak>"
 },
 "audioConfig": {
  "audioEncoding": "mp3"
 }
}

Run Code Online (Sandbox Code Playgroud)

回复：

{
 "audioContent":"//NExAAAAANIAAAAABcFAThYGJqMWA..."
}

Run Code Online (Sandbox Code Playgroud)

它只提供没有任何上下文信息的合成音频。

是否有我忽略的 API 请求可以公开有关这些标记的信息，例如IBM Watson和Amazon Polly 的情况？

markers ssml google-text-to-speech google-cloud-speech

Jam*_*mes

2019 08-09

14
推荐指数

2
解决办法

797
查看次数

标签统计

google-cloud-speech ×1

google-text-to-speech ×1

markers ×1

ssml ×1

如何从 Google Cloud text-to-speech API 获取 SSML &lt;mark&gt; 时间戳

标签 统计

小编Jam_mes的帖子

如何从 Google Cloud text-to-speech API 获取 SSML <mark> 时间戳

标签统计