tar 存档的重复数据删除

cpt*_*ggy 3 linux zfs tar deduplication

现在我正在尝试在我的 linux 备份服务器上使用重复数据删除配置 ZFS,并且有一个问题。例如,我在 backup1.tar 中有 1k 个文件,在 backup2.tar 中有 1k 个相同的文件和 1 个新文件。这些文件是否会进行重复数据删除?正如我所看到的,它不适用于 tar 档案。也许我做错了什么。

Chr*_*s S 6

tars 中的某些块可能是相同的,但可能性很小。ZFS 在块级别(在 ZFS 术语中称为记录大小)进行重复数据删除,因此各个块需要相同。tars 基本上可以保证运行完全相同的内容,但是这是否会组成一个完整的块并进行块对齐是极不可能的。

如果您想利用 ZFS 重复数据删除进行备份,请使用快照和发送/接收功能。这具有使用松弛空间的正常缺点(存储分配给记录大小块中的文件,如果文件不使用整个块,则会浪费剩余空间)。Tar 避免了这个“问题”,但您必须创建增量 tar 备份来重新创建重复数据删除效果。