为什么要使用 RAID 1 和 LVM 作为文件服务器?

Mar*_*ing 7 raid

我是一名兼职系统管理员,几乎没有正式的文档。我们的主要文件服务器是在 2010 年由一个已经不在研究所的人建立的。当时的要求是拥有三个共享文件系统:/home每个用户都有配额和备份,/usr/remote用于大型软件包,以及一个/scratch没有配额和没有备份的文件系统。仔细研究磁盘,我发现了一个 LVM 和一个带有专有软件的 RAID 控制器。

该服务器显然有 14 个磁盘,每个磁盘的容量为 1 TB。它们使用 RAID 1 成对连接。 RAID 控制器(Areca Technology Corp. ARC-1280/1280ML 24-Port PCI-Express to SATA II RAID Controller)支持 RAID 5 和 6(规格),但不知何故没有被使用。然后一对用作该服务器的根分区,/. 其他六对链接到一个 LVM 组中,然后该组具有三个分区。

在此处输入图片说明

我询问了原因,其中一位资深人士只能告诉我,设置它的人应该知道相当一部分 LVM,并且真的考虑过这个问题。但是我看不到这种设置的优点。我只看到缺点:

  • 我们有 12 个具有 1 TB 原始存储空间的磁盘,配对后我们最终只有 6 TB 的实际可用空间。将 RAID 5 与所有这些磁盘一起使用,我们将获得 11 TB 的存储空间,而使用 RAID 6 将获得 10 TB 的存储空间。即使我们将两组六个磁盘放入 RAID 6,那么它仍然是 8 TB 的可用空间。

  • 最坏的情况是磁盘故障是一整对,然后部分 LVM 丢失,我认为基本上系统会被搞砸。最好的磁盘故障情况是每对中的一个,因此这将是七个损坏的磁盘。因此,在最坏的情况下,从冗余的角度来看,我们并不比 RAID 5 好。

使用 RAID 6,我们将有两个冗余,但与当前设置相比,仍然可以使用更多的空间。那么导致人们以这种方式设置它的关键优势是什么?

bat*_*a09 7

使用 RAID 6,我们将有两个冗余,但与当前设置相比,仍然可以使用更多的空间。那么导致人们以这种方式设置它的关键优势是什么?

确实如此,但与 RAID10 相比,再加上更大的容量和保证的 2 个磁盘冗余,随机写入操作的性能会慢得多(我认为是您的情况下的最佳设置)。对于备份 - 可以,对于用户共享和另一个工作负载是有问题的。此外,旧硬盘在 RAID5/6 重建期间具有更高的故障风险。

  • @马丁尤丁。RAID10 的设计速度更快。在更快的情况下,我的意思是更低的延迟和更高的写操作 IOPS 计数。使用 20 个磁盘,您将获得一个 RAID0 中的 10xRAID1 组 (3认同)
  • 在我们的情况下,RAID 10 意味着我们会将这些对与 RAID 0 连接起来,然后将两对连接到 RAID 1?我认为单个大文件的吞吐量可能更高,但我猜延迟会增加。— 我们集群中的高性能系统采用 RAID 6,每个控制器大约有 20 个磁盘。然后我们有几个 Lustre 服务器通过 Infiniband 提供此功能。由于这是由集群人员操作的,我猜他们是否使用了 RAID 10 而不是 RAID 6,如果它会更快? (2认同)
  • 作为分布式并行文件系统,Lustre 是一个不同的野兽。通常,它们分布在许多具有小型磁盘阵列甚至单个磁盘的节点上。每个阵列不一定有几十个磁盘。 (2认同)

小智 2

好图!:-)

是的,这看起来确实有点奇怪。如果没有品牌/型号的具体信息,我们不知道这是否是由于硬件限制或其他原因造成的,但如果不是的话,我会感到惊讶,这不是由于对可用 RAID 选项的误解或其他原因造成的。缺乏对如何设置的了解。也许他们非常了解 LVM,并且只是坚持他们所知道的。

出于稳定性和性能原因,我通常建议依赖硬件 raid。

  • 我添加了 RAID 控制器的品牌和型号,以及规格链接。据说它支持 0、1、1E、3、5、6 和专有的 *JBOD* RAID 级别。 (3认同)