槟榔 1280ml RAID6 卷集失败

Ric*_*ard 10 raid backup raid-controller raid6

今天,我们遇到了某种最坏的情况,并对任何类型的好主意持开放态度。

这是我们的问题:

我们正在使用多个专用存储服务器来托管我们的虚拟机。在我继续之前,这里是规格:

  • 专用服务器机器
  • 槟榔 1280ml RAID 控制器,固件 1.49
  • 12 个三星 1TB 硬盘

我们配置了一个 RAID6 集,其中包含 10 个磁盘,其中包含一个逻辑卷。我们在系统中有两个热备件。

今天一个硬盘坏了。这种情况时有发生,所以我们更换了它。重建第二张光盘失败。通常这并不好玩。我们停止了繁重的 IO 操作以确保稳定的 RAID 重建。

遗憾的是,热备盘在重建时失败了,整个过程停止了。

现在我们有以下情况:

  • 控制器说raid set正在重建
  • 控制器说卷失败

这是一个RAID 6系统,两块磁盘故障,所以数据必须完好无损,但我们不能再次使卷联机访问数据。

在搜索时,我们发现了以下线索。不知道是好是坏:

  1. 将所有光盘镜像到第二组驱动器。因此,我们将有可能尝试不同的事情,而不会失去比我们已有的更多。

  2. 尝试在 R-Studio 中重建阵列。但是我们对软件没有真正的经验。

  3. 拉出所有驱动器,重新启动系统,更改为 areca 控制器 bios,逐个重新插入 HDD。有人说是通过这个使系统上线的。有人说效果为零。有人说,他们搞砸了整个事情。

  4. 使用未记录的槟榔命令,如“rescue”或“LeVel2ReScUe”。

  5. 联系计算机取证服务。但是哇...通过电话的初步估计超过了 20.000 欧元。这就是为什么我们会亲切地寻求帮助。也许我们错过了显而易见的事情?

是的,当然,我们有备份。但是有些系统丢失了一周的数据,这就是我们希望让系统重新启动并运行的原因。

非常欢迎任何帮助、建议和问题。

Ist*_*van 0

不幸的是,这是一种非常常见的情况。几年前,谷歌对此进行了一项很好的研究,结果表明,在重建阵列期间可能会发生 RAID 数据丢失的情况。这可能会以不同的严重程度影响不同的 RAID 系统。这是 RAID6 场景:

  • 您的阵列有 3 个数据磁盘和 2 个奇偶校验磁盘。
  • 如果您丢失一张磁盘,则可以肯定所有数据都可以恢复。
  • 如果丢失 2 个磁盘,您就会丢失数据

这是为什么?

考虑以下内容:让我们有一些数据,假设文件的前 3 个块有以下数据块:A1 + A2 + A3 以及以下奇偶校验:Ap + Ap 位于 hdd1...hdd5

如果丢失 1 和 3 之间的任意两个磁盘,则由于数据不可恢复而丢失数据,则您有 2 个奇偶校验和 1 个数据块。

现在,具有 10 个磁盘的相同场景可能会有所不同,但我猜它的处理方式与将数据拆分为 8 个块并将奇偶校验保存到其他 2 个驱动器并拥有 2 个热备用驱动器的方式相同。您知道 RAID 控制器配置的详细信息吗?

我将开始从异地备份中恢复(我猜你有一些),并且服务回来尝试恢复尽可能多的数据,例如使用 Unix 并将驱动器添加到映像并将其用作循环设备。

http://wiki.edseek.com/guide:mount_loopback

您需要知道 RAID 控制器使用哪种元数据,如果幸运的话,某些工具(如 dmraid)支持它。

但这并不意味着您根本可以恢复数据,因为文件通常分布在许多块中,因此恢复可能无法恢复任何数据。

有关 RAID 的更多信息:

https://raid.wiki.kernel.org/index.php/RAID_setup