什么算作“大型”raid 5 阵列?

Rob*_*Rob 11 raid raid5

最近我办公室的 Buffalo TeraStation NAS 出现了一个问题,这让我开始调查 Raid 5。

我发现了几篇不同的文章,讨论在大型阵列或大型磁盘中使用 raid 5 的不合适性

这是一篇讨论重建具有大型消费驱动器的阵列的问题的示例文章

我想弄清楚什么算作“大”?

我们这里的 NAS 是一个 4 驱动器 Raid 5 设置,每个驱动器是 1 TB。驱动器发生故障并已更换,阵列当前正在重建。

就重建期间可能会出现问题而言,此设置是否构成如此之大?

这种设置在日常使用中的可靠性如何?

Chr*_*s S 18

设计磁盘阵列的可靠性:

  1. 找到您的驱动器的 URE 速率(制造商不喜欢谈论他们的驱动器故障,因此您可能需要挖掘才能找到它。它应该是 1/10^X,其中 X 通常在 12-18 左右)。
  2. 为您的存储需求确定可接受的风险率†。通常,这是 <0.5% 的失败几率,但在“临时”存储中可能有几个百分点,对于关键数据可能<0.1。
  3. 1 - ( 1 - [Drive Size] x [URE Rate]) ^ [Data Drives‡] = [Risk]
    对于具有多个奇偶校验磁盘的阵列或镜像中有超过一对磁盘的镜像,1将 Drives in Array的后面更改为具有奇偶校验/镜像的磁盘数。

所以我在一个阵列中有一组四个 1TB WD Green 驱动器。它们的 URE 率为 1/10^14。我将它们用作临时存储。1 - (1 - 1TB x 1/10^14byte) ^ 3=>3.3%在一个驱动器死机后重建阵列失败的风险。这些非常适合存储我的垃圾,但我不会将关键数据放在那里。

†确定可接受的故障是一个漫长而复杂的过程。可以概括为Budget = Risk * Cost。因此,如果失败将花费 100 美元,并且发生的可能性为 10%,那么您应该有 10 美元的预算来防止它发生。这极大地简化了确定风险、各种故障的成本以及潜在预防技术的性质的任务——但您明白了。 [Data Drives] = [Total Drives] - [Parity Drives]. 两个磁盘镜像 (RAID1) 和 RAID5 有 1 个奇偶校验驱动器。三磁盘镜像 (RAID1) 和 RAID6 有 2 个奇偶校验驱动器。可能有更多带有 RAID1 和/或自定义方案的奇偶校验驱动器,但不典型。


然而,这个统计方程确实有它的警告:

  • 该 URE Rate 是广告费率,并且在大多数下线的驱动器中通常更好。您可能会很幸运,购买比宣传的好几个数量级的驱动器。同样,您可能会得到一个因婴儿死亡而死亡的驱动器。
  • 一些生产线运行不良(运行中的许多磁盘同时出现故障),因此从不同的制造批次中获取磁盘有助于分散同时发生故障的可能性。
  • 较旧的磁盘更有可能在重建的压力下死亡。
  • 环境因素影响:
    • 通常热循环的磁盘更有可能死亡(例如,定期打开/关闭它们)。
    • 振动会导致各种问题 - 请参阅 YouTube 上IT 对磁盘阵列大喊大叫的视频。
  • “谎言分为三种:谎言、该死的谎言和统计数据”——本杰明·迪斯雷利

  • 一个 1TB 的驱动器将是 1000000000000 字节,因此根据您的 URE 速率,它的计算量略低于 3%|0.3%。 (2认同)

Sob*_*que 9

这篇文章存在的原因是为了引起人们对 HDD 上不可恢复的误码率的关注。具体来说,您的廉价“家用 PC”磁盘。它们的工厂规格通常为 1 / 10^14。这大约是 12.5TB 的数据,如果您使用 2TB 磁盘进行 RAID-5 的话……您会很快命中。

这意味着您应该:

  • 使用较小的 RAID 组,并接受更多浪费的空间。
  • 使用 RAID-6 并接受额外的写入惩罚。(比 RAID5 高 50%)
  • 购买更昂贵的磁盘 - “服务器级”的 UBER 规格为 1 / 10^16,这意味着这是一个有争议的问题。(1.2PB优于12.5TB)

我通常建议 RAID-6 通常是前进的方式,但它会降低您的性能。