如何计算音频文件中的口语音节数?

Vil*_*age 4 speech-recognition nlp

我有很多音频文件,干净的音频,只有普通话的口语.我需要估计每个文件中有多少个音节.OS X,Windows或Linux是否有可以估算这些工具的工具?

sample01.wav 15
sample02.wav 8
sample03.wav 5
sample04.wav 1
sample05.wav 18
Run Code Online (Sandbox Code Playgroud)

由于存在许多文件,因此首选命令行或批处理软件,例如:

$ application sample01.wav
15
Run Code Online (Sandbox Code Playgroud)
  • 使用语音到文本的解决方案,然后计算存在的字符数将适合.

mar*_*sei 11

语音的自动分割是一个活跃的科学领域,这意味着没有一种方法可以完美地运作.

2009年,de Jong和Wempe提出了一种使用Praat自动检测人类语音信号中音节的方法.这种方法与人工分割相比较,并且已经在许多第三方科学研究中使用.您可以在他们的科学文章(pdf)中找到该方法的详细描述,以及对先前提出的方法的历史观点.Praat脚本本身和几个教程可以在专门的网站上找到(www - speechrate).

您可能也对Harma开发的另一种分割算法感兴趣,该算法已在Matlab(Harma Syllable Segmentation)中实现