大数据 + 什么是正确的文件系统 ext4 或 xfs?

yae*_*ael 5 linux filesystems rhel ext4 xfs

我们有 Linux Redhat 7.2 版,带有 xfs 文件系统。

from /etc/fstab

/dev/mapper/vgCLU_HDP-root /                       xfs     defaults        0 0
UUID=7de1ab5c-b605-4b6f-bdf1-f1e8658fb9 /boot                   xfs     defaults        0 0
/dev/mapper/vg
/dev/mapper/vgCLU_HDP-root /                       xfs     defaults        0 0
UUID=7de1dc5c-b605-4a6f-bdf1-f1e869f6ffb9 /boot                   xfs     defaults        0 0
/dev/mapper/vgCLU_HDP-var /var                    xfs     defaults        0 0 var /var                    xfs     defaults        0 0
Run Code Online (Sandbox Code Playgroud)

这些机器用于 hadoop 集群。

我只是想为此目的最好的文件系统是什么?

那么对于用于 hadoop 集群的机器,EXT4 或 XFS 哪个更好?

Ste*_*itt 6

这是在解决这个知识库文章; 您的主要考虑因素是可用的支持级别:最高支持 50TB 的 Ext4,最高 500TB 的 XFS。对于真正的大数据,您最终可能会查看共享存储,默认情况下是指 RHEL 7 上的 GFS2,但对于 Hadoop,您将使用 HDFS 或 GlusterFS。

对于 RHEL 上的本地存储,默认值是 XFS,除非有特殊原因,否则您通常应该使用它。