查找重复的 PDF

Elv*_*vin 5 pdf similarity

我正在寻找一个可以帮助我查找重复 PDF 的实用程序。问题:我有 1000 个 PDF 文件。有些是重复的。由于文件名不同且文件大小差异较小,因此不容易检测到它们。是否有实用程序/算法/库可以帮助我找到重复项或向我显示非常相似(或差异程度)的文件?

Ant*_*rre 1

DiffPDF看起来可能对你有帮助。