Verizon SongID - 如何编程?

Che*_*eso 6 audio verizon-wireless audio-processing audio-analysis

对于不熟悉Verizon的SongID程序的人来说,它是一个可通过Verizon的VCast网络下载的免费应用程序.它会在歌曲中的任何一点听一首歌10秒钟,然后将这些数据发送给一些全知的算法兽,将其咀嚼起来并送回所有ID3标签(艺术家,专辑,歌曲等......)

前两部分和最后一部分是直截了当的,但在录制声音发送后的处理过程中会发生什么?

我认为它必须采取声音文件(什么格式?),解析它(如何?用什么?)一些关键标识符(这些是什么?波函数的常规属性?相位/移位/幅度/等),并检查它针对数据库.

我在网上找到的关于它是如何工作的一切都像我上面输入的一样通用.

来自audiotag.info

该服务基于先进的音频识别算法,结合了先进的音频指纹识别技术和大型歌曲数据库.上传音频文件时,音频引擎会对其进行分析.在分析期间,通过将音频"指纹"与音乐数据库进行比较来提取和识别其音频"指纹".在该识别过程完成时,在屏幕上显示关于具有匹配概率的歌曲的信息.

Stu*_*lar 5

所有这些服务都是通过从客户端采样的音频数据中获取"指纹",将其发送到服务器并将其与指纹数据库进行比较来实现的.

Shazam的开发人员之一撰写了一篇关于该技术如何运作的非常丰富的白皮书.这应该为您提供所需的所有信息.