相关疑难解决方法(0)

在音频文件中查找音频样本(频谱图已存在)

我正在努力实现以下目标:

  • 使用 Skype,呼叫我的邮箱(有效)
  • 输入密码告诉邮箱我要录制新的欢迎信息(有效)
  • 现在,我的邮箱告诉我在哔哔声后录制新的欢迎信息
  • 我想等待哔声然后播放新消息(不起作用)

我如何尝试实现最后一点:

  • 使用 FFT 和滑动窗口创建频谱图(有效)
  • 为蜂鸣声创建“指纹”
  • 在来自Skype的音频中搜索该指纹

我面临的问题如下:
Skype 音频和参考哔声的 FFT 结果在数字意义上不相同,即它们相似但不相同,尽管哔声是从音频中提取的带有Skype音频录音的文件。下图显示了左侧 Skype 音频的蜂鸣声频谱图和右侧参考蜂鸣声的频谱图。如您所见,它们非常相似,但又不一样...
上传了一张图片 http://img27.imageshack.us/img27/6717/spectrogram.png

我不知道,如何从这里继续。我应该平均它,即将它分成列和行,并按照此处所述比较这些单元格的平均值吗?我不确定这是最好的方法,因为他已经说过,它不适用于短音频样本,并且哔声的长度不到一秒......

有关如何进行的任何提示?

.net c# audio comparison fft

5
推荐指数
1
解决办法
2321
查看次数

标签 统计

.net ×1

audio ×1

c# ×1

comparison ×1

fft ×1