槟榔 1280ml RAID6 卷集失败

Question

今天，我们遇到了某种最坏的情况，并对任何类型的好主意持开放态度。

这是我们的问题：

我们正在使用多个专用存储服务器来托管我们的虚拟机。在我继续之前，这里是规格：

我们配置了一个 RAID6 集，其中包含 10 个磁盘，其中包含一个逻辑卷。我们在系统中有两个热备件。

今天一个硬盘坏了。这种情况时有发生，所以我们更换了它。重建第二张光盘失败。通常这并不好玩。我们停止了繁重的 IO 操作以确保稳定的 RAID 重建。

遗憾的是，热备盘在重建时失败了，整个过程停止了。

现在我们有以下情况：

这是一个RAID 6系统，两块磁盘故障，所以数据必须完好无损，但我们不能再次使卷联机访问数据。

在搜索时，我们发现了以下线索。不知道是好是坏：

将所有光盘镜像到第二组驱动器。因此，我们将有可能尝试不同的事情，而不会失去比我们已有的更多。
尝试在 R-Studio 中重建阵列。但是我们对软件没有真正的经验。
拉出所有驱动器，重新启动系统，更改为 areca 控制器 bios，逐个重新插入 HDD。有人说是通过这个使系统上线的。有人说效果为零。有人说，他们搞砸了整个事情。
使用未记录的槟榔命令，如“rescue”或“LeVel2ReScUe”。
联系计算机取证服务。但是哇...通过电话的初步估计超过了 20.000 欧元。这就是为什么我们会亲切地寻求帮助。也许我们错过了显而易见的事情？

是的，当然，我们有备份。但是有些系统丢失了一周的数据，这就是我们希望让系统重新启动并运行的原因。

非常欢迎任何帮助、建议和问题。

Answer 1

不幸的是，这是一种非常常见的情况。几年前，谷歌对此进行了一项很好的研究，结果表明，在重建阵列期间可能会发生 RAID 数据丢失的情况。这可能会以不同的严重程度影响不同的 RAID 系统。这是 RAID6 场景：

这是为什么？

考虑以下内容：让我们有一些数据，假设文件的前 3 个块有以下数据块：A1 + A2 + A3 以及以下奇偶校验：Ap + Ap 位于 hdd1...hdd5

如果丢失 1 和 3 之间的任意两个磁盘，则由于数据不可恢复而丢失数据，则您有 2 个奇偶校验和 1 个数据块。

现在，具有 10 个磁盘的相同场景可能会有所不同，但我猜它的处理方式与将数据拆分为 8 个块并将奇偶校验保存到其他 2 个驱动器并拥有 2 个热备用驱动器的方式相同。您知道 RAID 控制器配置的详细信息吗？

我将开始从异地备份中恢复（我猜你有一些），并且服务回来尝试恢复尽可能多的数据，例如使用 Unix 并将驱动器添加到映像并将其用作循环设备。

您需要知道 RAID 控制器使用哪种元数据，如果幸运的话，某些工具（如 dmraid）支持它。

但这并不意味着您根本可以恢复数据，因为文件通常分布在许多块中，因此恢复可能无法恢复任何数据。

有关 RAID 的更多信息：