JPEG内置校验和/指纹?

Par*_*and 6 jpeg checksum fingerprint

我正在整理一个脚本来查找大型图像库中的删除重复项.目前我正在做一个双通过滤器,首先找到相同大小的文件,然后在10240字节的文件上做一个sha256,以获得具有相同大小的文件的指纹(这里是代码).

它运行良好,但我猜我可能使用jpeg格式内置校验和,而不是使用sha256.

有谁知道是否有校验和或其他组件可以作为校验和/指纹?如果是这样,是否有一种有效的方式来访问它们?

Mar*_*som 5

我不认为 JPEG 规范以您描述的方式包含任何类型的校验和。

不过,JPEG 可以包含缩略图作为其 EXIF 元数据的一部分。这不是一个完美的指标,因为两个不同的图像可能具有相同的缩略图。至少有一个记录在案的案例是,在图像经过大量修改后,缩略图没有被替换,该缩略图显示的内容比出版商预期的要多得多。