Mar*_*ret 6 software-rec deduplication
我有一个装满文件的文件夹,里面有许多重复的文件。不幸的是,在许多情况下,一个版本是另一个版本的更新版本,因此直接字节匹配无法定位重复。(我看过这个问题,但我从列表中看过的所有问题似乎都只进行字节计数比较......)
是否有任何 (Windows) 重复数据删除应用程序可以进行相似性匹配并将用户指向相关文件进行检查?免费软件是好的,免费试用是可以接受的。即使只是一个相似之处来告诉我在哪里看也可能会奏效。
编辑:对不起,我应该提到;这些是基于文本的文件,主要是 DOC、PPT 和 PDF。最有可能发生变化的是内容,但格式也可能有所不同。即使只是接受文本更改也可能会有所帮助......
小智 0
我不知道有任何应用程序,但如果版本之间的大部分内容相同,您可以使用“文件中的单词或短语”选项对目录进行 Windows 搜索。您的查询将是一个特定的短语,它在版本之间不会发生太大变化(或者至少您认为没有变化),并且对于该特定文档/文档集来说是相当独特的。这种类型的搜索应该适用于 PDF、DOC 和 PPT,尽管它们不是直接的文本文件。这不会为您提供所需的确切输出,但如果您选择好搜索短语并且版本之间的内容变化不大,那么它应该可以很好地工作。