在 linux 上有效地存储重复文件

Bre*_*uir 7 linux filesystems ubuntu-12.04

我托管了很多网站,我们的系统可以轻松复制这些网站中的项目,这很方便,但会导致大量重复(并且可能非常大)文件。我想知道这些是否是 linux(特别是 Ubuntu)中的任何机制,其中文件系统只会存储文件一次但从其所有位置链接到它。

我需要它是透明的,并且还处理这样的情况,如果用户更改了其中一个文件,它不会更改主文件的内容,而是仅为文件的这个特定实例创建一个新文件。

练习的目的是减少重复文件使用的空间浪费。

poi*_*ige 5

我需要这个是透明的

ZFS-on-Linux × 功能称为“在线重复数据删除”。

更新。:我已经再次阅读了您的问题,现在看来Aufs可以为您提供帮助。这是托管环境非常流行的解决方案。实际上我现在也可以自己提到 Btrfs——模式是你有一些模板子卷,你每次需要另一个实例时都会对它进行快照。它是 COW,因此只有更改的文件块才需要更多空间。但请记住,Btrfs 是,呃……好吧,无论如何都不太稳定。仅当其上的数据绝对可以消失时,我才会在生产中使用它。