xra*_*alf 5 algorithm hash duplicates
我想检测目录树中的重复文件.如果找到两个相同的文件,则只保留其中一个副本,并删除剩余的重复项以节省磁盘空间.
复制意味着具有相同内容的文件可能在文件名和路径上不同.
我正在考虑为此目的使用哈希算法但是有可能不同的文件具有相同的哈希值,所以我需要一些额外的机制来告诉我文件不一样,即使哈希值是相同的因为我不喜欢我想删除两个不同的文件.
您会使用哪种额外快速可靠的机制?
Shi*_*dim 17
计算哈希将使您的程序运行缓慢.你也可以检查文件大小.所有重复文件应具有相同的文件大小.如果他们共享相同的文件大小应用哈希检查.它会让你的程序表现得更快.
可以有更多的步骤.
您添加的条件越多,它的执行速度就越快,您可以通过这种方式避免最后的手段(哈希).