小编Jam*_*ran的帖子

通过 MD5 哈希查找所有重复文件

我正在尝试查找所有重复文件(基于 MD5 哈希)并按文件大小排序。到目前为止,我有这个:

find . -type f -print0 | xargs -0 -I "{}" sh -c 'md5sum "{}" |  cut -f1 -d " " | tr "\n" " "; du -h "{}"' | sort -h -k2 -r | uniq -w32 --all-repeated=separate
Run Code Online (Sandbox Code Playgroud)

这个的输出是:

1832348bb0c3b0b8a637a3eaf13d9f22 4.0K   ./picture.sh
1832348bb0c3b0b8a637a3eaf13d9f22 4.0K   ./picture2.sh
1832348bb0c3b0b8a637a3eaf13d9f22 4.0K   ./picture2.s

d41d8cd98f00b204e9800998ecf8427e 0      ./test(1).log
Run Code Online (Sandbox Code Playgroud)

这是最有效的方法吗?

linux sorting md5sum

7
推荐指数
1
解决办法
8655
查看次数

标签 统计

linux ×1

md5sum ×1

sorting ×1