DFS-R 压缩算法与 7-zip 相比如何?

Rob*_*son 3 windows dfs-r windows-server-2012

我们需要定期通过 50Mbps 的租用线路在我们的 WAN(英国到美国)周围传输大型 (60GB) Hyper-V 虚拟机映像。我们还在站点之间使用 DFS-R。从历史上看,我使用 7-zip 压缩虚拟机(压缩成更小的 100MB 块),然后将文件放入 DFS-R 传输文件夹中。当积压清除后,在另一端解压缩。

我想知道我是不是在浪费时间,还不如将整个 VM(主要是 VMDX 文件)放在传输文件夹中,让 DFS-R 在传输过程中对其进行压缩。

所以问题是 - 与 7-zip 的原生 7z 格式相比,DFS-R 压缩算法的效率如何?7-zip 将图像压缩到大约 20GB,因此节省了 70%。

我觉得打包和解包的额外时间超过了 7-zip 算法中任何可能的更高压缩率。也就是说,传输 100MB 的数据块感觉比一个 50GB 的大 VMDX 文件“更好”。

Mat*_*sen 5

DFS-R 使用称为远程差分压缩的东西。

该算法将比较源和目标副本之间连续数据块的签名,而不是比较和传输整个文件。这样,只有不同的数据块需要通过线路传输,以便在目标位置“重建”文件。

因此,RDC 无法与 7-zip 中使用的压缩算法相提并论。尽管它们使用类似的技术(在数据范围内构建签名字典),但 7-zip 算法旨在将字节重新排列为无损容器格式,其中所有数据都被“压缩”在一起,其中 RDC 的目的是识别相似文件或文件版本,以尽量减少传输的数据量,以保持副本同步

如果目标位置已有类似的 VMDX 文件,则无需将文件拆分为 100MB 的块。请确保在压缩图像时始终使用相同的压缩算法

这种行为(比较类似的文件,相同的文件不是截然不同的版本,并提取块)被称为“交叉文件RDC”和公开获得的文件是相当稀疏,但AskDS博客队有一个很短,但不错的澄清中这个问答帖