Ada*_*dam 5 filesystems nfs high-availability openafs
是否有积极开发的分布式,高可用性文件系统(适用于Linux)?
让我更具体一点:
分布式意味着它可以优雅地处理客户端到服务器的延迟,就像您在全球公共互联网上找到的那样(300毫秒及以上),偶尔也会出现连接错误.这意味着需要非常好的客户端缓存(即使用回调).NFS不会这样做.它还意味着无需IPSEC VPN即可加密线上数据.
高可用性意味着数据可以存储在多个服务器上,而客户端足够智能,可以在遇到问题时尝试其他服务器.将这些智能放在客户端非常重要,这就是为什么这种东西不能只被移植到NFS上的原因.对于只读数据,至少需要这样.这对于读写数据会很好,但我知道这很难.
文件系统意味着导出POSIX接口的内核驱动程序,并且在不可信任的客户端面前强制执行权限和访问控制.SAN系统通常假设客户端值得信赖.
我是OpenAFS的难民.我喜欢它,但此时我不能再接受它要求所有文件服务器在所有其他文件服务器上有效"拥有"的要求.必须运行Kerberos基础结构(我不需要)的专有磁盘格式和开销也变得越来越成问题.
除了具有这些属性的OpenAFS之外,还有其他系统吗?Intermezzo和Coda可能有资格但不再是活跃的项目.Lustre很酷,但似乎是专为超低延迟数据中心而设计的.Ceph很棒但不是真正的文件系统,更多的是在文件系统下运行的东西(是的,有CephFS,但它确实是Ceph的展示,并且显然没有生产就绪,并且没有时间表).Tahoe-LAFS很酷但它和GoogleFS并不是真正的文件系统,因为它们不通过内核模块导出POSIX接口.我对GFS(全局文件系统)的理解是客户端可以直接操作磁盘上的数据结构,因此它们是隐含的根级信任(这也是它快速的部分原因) - 如果我错了,请纠正我这里.
需要开源,因为我无法承担将我的数据锁定在专有的东西.我不介意为软件付费,但在这种情况下我不能被扣为人质.
谢谢,
首先,您可以通过fscache工具使用cachefilesd(由Debian上的cachefilesd包提供)使用本地文件系统-o user_xattr(通过 挂载-o fsc)来缓存NFS(通过 挂载)。
尽管您正在寻找的文件系统可能不存在,但恕我直言,两个项目非常接近,具有相当好的FUSE客户端实现:
Gfarm 文件系统(BSD/Apache-2.0,托管于SourceForge)
在对Ceph进行了相当长的评估之后,我得出的结论是它是有缺陷的(在可预见的未来没有改进的希望)并且不适合认真使用。XtreemFS也令人失望。我希望即将推出的OrangeFS版本 3(承诺进行数据完整性检查)可能不会太糟糕,但这还有待观察......