我正在使用 rsync 备份一个包含许多 gz 文件的存储库,其中包括每天都有许多新文件。rsync 备份进行得比它应该的慢,因为这些 gz 文件不是用 gzip 的 --rsyncable 选项构建的(这使得 gz 文件更加“rsync-friendly”而不显着增加它们的大小或影响它们的兼容性)。而且我无法在创建时解决问题,因为文件是由使用 python 的 gzip 模块的 python 脚本 (rdiff-backup) 生成的,这不支持等效于 gzip 的 --rsyncable。
因此,在运行 rsync 之前,我可以识别源数据中的任何新 gz 文件(即自上次运行 rsync 以来的新文件)。现在我想“重新压缩”这些文件,以便它们以 rsyncable 格式压缩。然后我可以从优化的源运行 rsync。
我认为这意味着通过 gunzip 然后 gzip --rsyncable 运行每个文件,但我不太确定如何以不会丢失数据或元数据的方式执行此操作。感激地收到建议。