如何在笔录中突出显示补语(Um,uh,ah)?

jer*_*dev 5 ruby google-cloud-speech

谷歌云语音中是否有配置可以让我看到返回的JSON记录中的填充词?目前,似乎Google云端语音返回的记录会自动过滤掉此类单词(嗯,嗯,啊等等)。

我尝试在音频识别呼叫中使用“ phrases”参数,该参数着重于检测音频中的特定短语。

wordsToDetect = ["um", "like", "so", "honestly", "basically", "actually", "uh"]

audio = speech.audio output_filepath,
                     encoding: :flac,
                     language: "en-US"

results = audio.recognize phrases: wordsToDetect
Run Code Online (Sandbox Code Playgroud)

Google Cloud Speech是否会自动过滤掉诸如“ um”和“ uhhh”之类的填充词?

小智 0

几乎所有语音识别 API 都无法检测填充声音,例如 Ahs、Ums、Uhs 等。为了检测这些声音,必须训练算法来检测这些特定声音。