为什么同一文件的两个tarball的md5哈希值不同?

Mar*_*son 8 linux compression hash md5 tar

我可以跑:

echo "asdf" > testfile
tar czf a.tar.gz testfile
tar czf b.tar.gz testfile
md5sum *.tar.gz
Run Code Online (Sandbox Code Playgroud)

事实证明,a.tar.gz并且b.tar.gz有不同的md5哈希值.确实,他们是不同的,这diff -u a.tar.gz b.tar.gz证实了.

我需要传递哪些额外的标志,tar以便它的输出随着时间的推移与相同的输入一致?

Bar*_*mar 13

tar czf outfile infiles 相当于

tar cf - infiles | gzip > outfile
Run Code Online (Sandbox Code Playgroud)

文件不同的原因是因为gzip将其输入文件名和修改时间放入压缩文件中.当输入是管道时,它使用空字符串作为文件名,使用当前时间作为修改时间.

但它也有一个--no-name选项,告诉它不要将名称和时间戳放入文件中.因此,如果您显式编写扩展命令,而不是使用-z选项tar,则可以使用此选项.

tar cf - testfile | gzip --no-name > a.tar.gz
tar cf - testfile | gzip --no-name > b.tar.gz
Run Code Online (Sandbox Code Playgroud)

我在OS X 10.6.8上测试了这个并且它可以工作.