RAID5 阵列准备重建

Tre*_*orW 3 hp hp-smart-array hardware-raid hp-proliant raid5

我继承了对带有 RAID 5 阵列的服务器的管理。我们在阵列上有一个损坏的数据库,它刚刚超过分配大小的一半,因此无法恢复。
我最近将托架 25 中的备用磁盘更改为阵列的一部分(将为数据库恢复提供足够的空间),重建看起来开始正常。
但随后报告了 22 号托架中的故障磁盘。这已被替换,现在我被困在显示阵列配置状态“RAID5,准备重建”的服务器上。
任何人都可以帮忙吗?

=> ctrl slot=1 show config

Smart Array P600 in Slot 1    (sn: P92B3AF9SXL040)

array A (SAS, Unused Space: 297996 MB)

  logicaldrive 1 (6.3 TB, RAID 5, Ready for Rebuild)

  physicaldrive 1E:1:1 (port 1E:box 1:bay 1, SAS, 300 GB, OK)
  physicaldrive 1E:1:2 (port 1E:box 1:bay 2, SAS, 300 GB, OK)
  physicaldrive 1E:1:3 (port 1E:box 1:bay 3, SAS, 300 GB, OK)
  physicaldrive 1E:1:4 (port 1E:box 1:bay 4, SAS, 300 GB, OK)
  physicaldrive 1E:1:5 (port 1E:box 1:bay 5, SAS, 300 GB, OK)
  physicaldrive 1E:1:6 (port 1E:box 1:bay 6, SAS, 300 GB, OK)
  physicaldrive 1E:1:7 (port 1E:box 1:bay 7, SAS, 300 GB, OK)
  physicaldrive 1E:1:8 (port 1E:box 1:bay 8, SAS, 300 GB, OK)
  physicaldrive 1E:1:9 (port 1E:box 1:bay 9, SAS, 300 GB, OK)
  physicaldrive 1E:1:10 (port 1E:box 1:bay 10, SAS, 300 GB, OK)
  physicaldrive 1E:1:11 (port 1E:box 1:bay 11, SAS, 300 GB, OK)
  physicaldrive 1E:1:12 (port 1E:box 1:bay 12, SAS, 300 GB, OK)
  physicaldrive 1E:1:13 (port 1E:box 1:bay 13, SAS, 300 GB, OK)
  physicaldrive 1E:1:14 (port 1E:box 1:bay 14, SAS, 300 GB, OK)
  physicaldrive 1E:1:15 (port 1E:box 1:bay 15, SAS, 300 GB, OK)
  physicaldrive 1E:1:16 (port 1E:box 1:bay 16, SAS, 300 GB, OK)
  physicaldrive 1E:1:17 (port 1E:box 1:bay 17, SAS, 300 GB, OK)
  physicaldrive 1E:1:18 (port 1E:box 1:bay 18, SAS, 300 GB, OK)
  physicaldrive 1E:1:19 (port 1E:box 1:bay 19, SAS, 300 GB, OK)
  physicaldrive 1E:1:20 (port 1E:box 1:bay 20, SAS, 300 GB, OK)
  physicaldrive 1E:1:21 (port 1E:box 1:bay 21, SAS, 300 GB, OK)
  physicaldrive 1E:1:22 (port 1E:box 1:bay 22, SAS, 300 GB, OK)
  physicaldrive 1E:1:23 (port 1E:box 1:bay 23, SAS, 300 GB, OK)
  physicaldrive 1E:1:24 (port 1E:box 1:bay 24, SAS, 300 GB, OK)
  physicaldrive 1E:1:25 (port 1E:box 1:bay 25, SAS, 300 GB, OK)
Run Code Online (Sandbox Code Playgroud)

eww*_*ite 10

这有点疯狂……智能阵列 P600 PCI-X RAID 控制器(大约 2005 年)?!?25盘?RAID 5?这是HP MSA70 机箱吗?大概不是HP D2700


“准备重建”是您在 HP ProLiant 系统上收到的最糟糕的阵列状态消息。这表明逻辑驱动器无法完成其重建,因为从伙伴或从属驱动器读取时出现问题。通常这意味着您有一个故障磁盘和一个故障磁盘。这也称为不可恢复的读取错误 (URE)。

请参阅以下内容:

RAID 1 故障“状态准备好重建:重建百分比完成 0%”

HP Proliant ML350 G5 SAS 硬盘

强制 HP Smart Array 中的 LUN 重建

RAID5 中的 24 个磁盘是愚蠢的。那不是你的错。不过,25 个磁盘是。RAID5 的驱动器太多了,即使您拥有 10k RPM 的企业磁盘。由于扩展如此大的磁盘组会影响I/O 和时间,因此为了增加 300GB 的空间而失去备用是一个糟糕的举动。它击中了所有磁盘,并且需要长时间。涉及太多的风险和暴露。

您遇到控制器固件问题或配置限制的可能性很小。该控制器的最新固件版本是在 2009 年。旧设备加上像您这样的异常配置是边缘情况,需要一些工作来修复。这也可能是外壳的问题。

  • 你有好的备份吗?
  • 您是否能够更新所有组件的固件?
  • 您能否在此处重新启动所有内容并仔细观察系统 POST 消息以读取 RAID 控制器输出?
  • 假设驱动器上没有真正的READ 错误,您也许能够快速启动重建过程。

所以这是违反直觉的,但关机、等待和开机可能是你最好的选择。
这也可能是你最糟糕的选择,所以希望你有备份。:(