Python语音比较

Kre*_*ade 5 python speech-recognition speech-to-text cmusphinx

我有两个.wav文件,我需要比较并确定它们是否包含相同的单词(同样的顺序).

我一直在寻找最好的方法.我无法弄清楚如何让pyspeech使用文件作为输入.我试过让CMU sphinx项目正常工作,但我似乎无法让GStreamer使用Python 27,更不用说他们的项目了.我也和DragonFly搞乱了,没有运气.

我在Python27上使用Win7 64bit.有没有人有任何想法?

任何帮助是极大的赞赏.

Mic*_*evy 5

你可以试试PySpeech。有关更多信息,请参阅pyspeech (python) - 转录 mp3 文件?. 我从未使用过它,但我相信它利用了 Windows 的内置语音识别引擎。这将让您将 Wav 文件转换为文本,然后您可以进行文本比较。

要使用 Windows 语音引擎并使用 wav 文件进行输入,有两个要求。

  1. 使用 inproc 识别器 (SpeechRecognitionEngine)。共享识别器不能使用 Wav 文件作为输入。
  2. 在识别器对象上调用 SetInputToWaveFile 来指定您的输入 wav 文件。

您可能需要对 wav 文件重新采样,因为语音识别引擎仅支持特定的采样率。

  • 每个样本 8 位
  • 单声道单声道
  • 每秒 22,050 个样本
  • PCM编码

在 Windows 上运行良好。有关更多信息,请参阅/sf/answers/434247341/

有关 Windows 语音引擎的更多背景知识,您可以查看SAPI 和 Windows 7 问题以及System.Speech.Recognition 和 Microsoft.Speech.Recognition 之间的区别是什么?