GTZAN音乐流派数据集

use*_*847 8 classification

我想在公共数据集中测试我的音乐类型算法,以与其他预先存在的算法进行比较.在MIREX的情况下,所有数据都不可用.我发现GTZAN数据集在链接中可用(marsyas.info/download/data_sets)但是,现在我无法使用它.

你知道我怎么能得到这些数据?因为我使用除MFCC以外的其他功能,所以我需要流派注释以及音乐.

提前致谢.

bet*_*r07 8

编辑:现在,似乎Marsyas页面托管在marsyasweb.appspot.com,您可以在数据集子页面中找到GTZAN数据库的链接.

我也一直在寻找GTZAN数据集我的大学项目,我发现http://marsyas.info是了,所以我用了谷歌marsyas.info/download/data_sets Web缓存(检查是否有更多的信息).幸运的是,GTZAN数据集是托管的http://opihi.cs.uvic.ca,您可以下载它们!

但在使用数据集之前请注意许可(来自缓存的marsyas下载页面的信息):

该数据集用于G.Tzanetakis和P.Cook在IEEE Transactions on Audio and Speech Processing 2002中的类型分类"音频信号的音乐类型分类"中的众所周知的论文.

不幸的是,数据库是在我的研究中逐渐收集的,所以我没有标题(显然没有版权许可等).这些文件是在2000-2001期间从各种来源收集的,包括个人CD,收音机,麦克风录音,以表示各种录音条件.Nevetheless我一直在应要求其提供给研究人员主要是出于比较的目的等,请联系乔治Tzanetakis(gtzan@cs.uvic.ca)如果你打算使用这个数据集发布实验结果.

数据集由每30秒长的1000个音轨组成.它包含10种类型,每种类型由100个轨道代表.这些曲目都是.wav格式的22050Hz单声道16位音频文件.

也许你会对其他数据集感兴趣,比如Magnatagatune - http://tagatune.org/Magnatagatune.html.


Ali*_*ian 3

我也在寻找这样的基准。
\n我在一篇名为“通过特征提取和机器学习从声音到 \xe2\x80\x98Sense\xe2\x80\x99 - 导出用于表征音乐的高级描述符”的论文中找到了这一点:

\n\n
\n

音乐信息检索社区目前正在进行一些工作,以编译带有标签的音乐的大型存储库,以便所有感兴趣的研究人员可以使用这些存储库,而不会出现版权问题。值得注意的例子有 Masataka\n Goto\xe2\x80\x99s RWC 音乐数据库 (http://staff.aist.go.jp/m.goto/RWC-MDB)、\n IMIRSEL(国际音乐信息)伊利诺伊大学厄巴纳-香槟分校的检索系统评估\n实验室)项目(http://www.music-ir.org/evaluation\xe2\x80\x94另请参阅[12]),以及新的\ n FreeSound 倡议 (http://freesound.iua.upf.edu)。

\n
\n\n

但我无法从他们身上找到任何有用的东西。这里描述了获取第一个提到的数据库副本的过程,但它看起来相当复杂!

\n