开源音频模式识别(指纹打印)

Var*_*ant 25 audio pattern-recognition audio-fingerprinting

有没有提供"Shazam like"解决方案的开源音频指纹识别解决方案?

Shazam使用Landmark digital的商业解决方案,但我正在寻找一种替代方案(即使在精度和性能方面都不如此)开源解决方案.

任何人都知道这种实现甚至是已发布的未实现的算法?

ter*_*ina 20

  • echoprint看起来像是商业libs的可靠替代品.

用于语音识别:

我们只测试了echoprint,到目前为止一直很好.

我知道答案有点晚了但是随着这个页面在谷歌弹出,我们可能会随着时间的推移改进它:)

编辑为CMU是面向语音的


小智 12

有一些开源音频识别项目,虽然你可以忘记商业音频识别服务的质量/性能,如Shazam,SoundHound等.它还取决于你想要做什么样的识别(音频文件指纹识别/标记,实时识别,OTA(空中)识别等)

打开Surce

  • AcoustID/MusicBrainz提供执行音频指纹识别和元数据关联(指纹识别器和服务器)的工具.您可以建立自己的指纹/元数据服务器或使用MusicBrainz的服务.音频文件指纹识别和识别的良好解决方案,不适用于实时高性能应用(即OTA).我们还测试了它用于音频流监控(广播监控),但结果很差.

  • Echoprint提供与AcoustID(指纹识别器和服务器+元数据)相同的工具,也可以用于音频流监控,因为它可以识别从音频中的任何位置获取的片段,具有良好的准确性(但我不会将其用于严肃的商业应用) .他们还声称它适用于OTA应用,但性能无法用于生产用途.

  • Last.fm虽然已经开源了指纹识别模块,但并非完全开源.您必须查询其标识和元数据提供程序服务,因为它们不提供完整的解决方案.


Var*_*ant 9

好.不同的搜索关键字,我寻找的所有结果.

http://musicbrainz.org/doc/Audio_Fingerprint

感谢所有观看者