在处理 jpg 或 h264 压缩文件时,像 fdupes 这样的工具是荒谬的矫枉过正。两个具有完全相同文件大小的此类文件已经很好地表明它们是相同的。
除此之外,如果提取并比较 16 个等距的 16 字节块,并且它们也相同,那么就有足够的证据让我假设它们是相同的。有这样的事吗?
(顺便说一句,我知道文件大小本身可能是一个相当不可靠的指标,因为可以选择压缩到某些目标大小,例如 1MB 或 1 CD/DVD。如果在许多文件上使用相同的目标大小,这是相当合理的一些不同的文件将具有完全相同的大小。)