QNAP ts-1679u-rp RAID 6 重建顺序错误

use*_*137 3 raid qnap

我有一个在 RAID 6 上运行的 qnap ts-1679u-rp。它有 2 个磁盘错误。因此,我将2个磁盘(磁盘3和磁盘13)更换为相同型号和容量的新磁盘。

它未能重建。
1.我尝试放回旧磁盘,但我忘记了顺序。所以我无论如何将它插入(磁盘 3 和磁盘 13)。
2、启动失败。
3.我交换了位置并重试。它无法启动。
4. 我将 VGA 连接到 QNAP 以查看控制台屏幕。
5.它说,无法连接,因为磁盘6读取错误。
6. 我尝试拔出所有 3 个磁盘(磁盘 3、磁盘 13、磁盘 6)。它启动并最终可以使用 Web 界面,但无法识别磁盘格式。我无法访问我的磁盘。
7. 用电把3、13、6盘推进去,还是不能访问我的盘。

我想我搞砸了我的 RAID 配置。我会丢失我的数据吗?我怎样才能从这次失败中恢复过来?

共有 16 个磁盘。我将所有 16 个磁盘用于 RAID 6。16x4TB。

Fal*_*mot 5

与 RAID 阵列一样,如果您不能让它自行重建,那么您就完了。听起来磁盘 6 也可能出现故障。随着三个磁盘的丢失(即使 RAID 控制器产生了这种丢失的幻觉),您的数据也几乎消失了。

我看你没有备份。这太糟糕了。但是,在您职业生涯的其余部分,我想您可能会开始正确使用 RAID。它有很多方面 - 一种分配工作负载以提高性能的方法,以及一种减少故障的直接操作影响的方法,否则需要从备份中恢复。它甚至可以用于在发生故障时限制数据丢失,短期(即小于您的备份间隔)。但是,RAID不是

  1. 备份的替代品。 您可能有严重的磁盘故障或 RAID 控制器可能出现故障,或者您的数据可能由于无数其他原因而丢失,从而导致软件或自然破坏它。
  2. 忽略磁盘故障或使用可疑磁盘的许可证。当您怀疑磁盘故障时,您必须立即纠正它。

将来在设计 RAID 阵列时,您应该非常仔细地考虑发生灾难性故障的几率,然后再进行纠正。对于包含两个磁盘的 RAID 1 阵列,它们同时发生故障的几率非常低,但在您的设置中,16 个中只有 3 个 (19%) 必须发生故障。基本概率表明数组是脆弱的。使用磁盘数量较少或可容忍故障数量较多的阵列。多卷可能会有所帮助;使用复合级别(如 RAID 10 和 RAID 60)聚合 RAID 卷。RAID 60 阵列最多可容忍 4 次故障(其中一半最多 2 次),您很可能没问题。

为了稍微扩展这个概念,当您使用 RAID 时,请考虑使用热备件。热备件非常棒,因为阵列可以立即开始重建,并以更快的速度摆脱降级状态。它们基本上是将磁盘添加到阵列的容错范围内,只要故障没有紧密聚集以防止及时重建。

另外,请考虑重建阵列所需的时间。复制 4TB 磁盘需要一段时间,这是磁盘阵列通常使用比 4TB 更小的磁盘构建的原因之一(还有其他原因)。

最后:

  • 使用高质量的磁盘。如果引用,请查看 MTTF。使用企业级的。溢价是有原因的。避免过度循环以节省电力或类似的“绿色”。
  • 标记您的磁盘。然后,您不会忘记它们的顺序。

希望这节课不会太贵。