与拍手探测器不同("Clap on!clap clap Clap off!clap clap Clap on,clap off,Clapper! clap clap ")我需要检测门何时关闭.这是一辆车,比房间或家门更容易:
听:http://ubasics.com/so/van_driver_door_closing.wav
它的采样速率为16位4khz,我希望避免大量处理或存储样本.
当您在大胆或其他波形工具中查看它时,它非常独特,并且由于车辆中声压的增加而几乎总是剪辑 - 即使窗户和其他门打开时:
听:http://ubasics.com/so/van_driverdoorclosing_slidingdoorsopen_windowsopen_engineon.wav
我希望有一个相对简单的算法可以读取4kHz,8位的读数,并跟踪"稳态".当算法检测到声级显着增加时,它将标记该点.
更新:使用Octave(开源数值分析 - 类似于Matlab)并查看均方根是否会给我我需要的东西(这导致与SPL非常相似的东西)
Update2:在简单的情况下,计算RMS可以轻松地关闭门:
现在我只需要看看困难的情况(收音机,高温/高空等).CFAR看起来非常有趣 - 我知道我将不得不使用自适应算法,CFAR肯定符合要求.
-亚当
我正在制作一个应用程序,当识别出拍手的声音时执行动作.我已经研究过简单地测量AVAudioRecorder的平均功率和峰值功率,这可以正常工作,但是如果有其他声音,那么它会报告很多误报.我相信我需要某种音频指纹识别,以便在播放其他音频时工作.现在我知道在SO之前已经问了很多这个问题,但大多数答案都说"使用FFT",然后那个人说"哦,好吧!" 但没有给出明确的解释,我仍然不知道如何使用FFT正确识别声音.
任何人都可以清楚地解释,引用另一个教程,或发布一个链接到一个可以使用音频指纹识别声音的库吗?
谢谢!