检测具有不同比特率和/或不同ID3标签的重复MP3文件?

12 python mp3 id3 file duplicates

我怎样才能检测到(最好用Python)可以用不同比特率编码的重复MP3文件(但它们是同一首歌)和可能不正确的ID3标签?

我知道我可以对文件内容进行MD5校验和,但这对于不同的比特率不起作用.我不知道ID3标签是否对生成MD5校验和有影响.我应该重新编码具有不同比特率的MP3文件,然后我可以进行校验和吗?您有什么推荐的吗?

tzo*_*zot 15

完全相同的问题是,旧的AudioScrobbler和目前在MusicBrainz的人们很久以前就已经开始工作了.目前,可以帮助您完成任务的Python项目是Picard,它将使用GUID(实际上是其中几个)标记音频文件(不仅是MPEG 1 Layer 3文件),从那时起,匹配标签很简单.

如果您更愿意将其作为自己的项目,libofa可能会有所帮助.


Dou*_*der 2

我不认为简单的校验和会起作用:

  1. ID3标签会影响md5
  2. 不同的编码器将以不同的方式对同一首歌曲进行编码 - 因此校验和会不同
  3. 不同的比特率会产生不同的校验和
  4. 将 mp3 重新编码为不同的比特率可能听起来很糟糕,并且肯定会与一步压缩的原始音频不同。

我认为您必须比较 ID3 标签、歌曲长度和文件名。