惠普智能阵列;如何安全地从阵列中移除具有 SMART 预测性故障的物理驱动器,以便进行更换?

gil*_*esw 9 linux raid hp hp-smart-array hp-proliant

hpacucli 控制器插槽=1 ld 1 显示详细信息

Smart Array P400 in Slot 1

   array A

      Logical Drive: 1
         Size: 273.3 GB
         Fault Tolerance: RAID 1+0
         Heads: 255
         Sectors Per Track: 32
         Cylinders: 65535
         Stripe Size: 128 KB
         Status: OK
         Array Accelerator: Enabled
         Unique Identifier: xxxx
         Disk Name: /dev/cciss/c0d0
         Mount Points: /boot 196 MB, / 7.8 GB
         Logical Drive Label: xxxxx
         Mirror Group 0:
            physicaldrive 1I:1:8 (port 1I:box 1:bay 8, SAS, 72 GB, Predictive Failure)
            physicaldrive 1I:1:7 (port 1I:box 1:bay 7, SAS, 72 GB, OK)
            physicaldrive 1I:1:6 (port 1I:box 1:bay 6, SAS, 72 GB, OK)
            physicaldrive 1I:1:5 (port 1I:box 1:bay 5, SAS, 72 GB, OK)
         Mirror Group 1:
            physicaldrive 2I:1:4 (port 2I:box 1:bay 4, SAS, 72 GB, OK)
            physicaldrive 2I:1:3 (port 2I:box 1:bay 3, SAS, 72 GB, OK)
            physicaldrive 2I:1:2 (port 2I:box 1:bay 2, SAS, 72 GB, OK)
            physicaldrive 2I:1:1 (port 2I:box 1:bay 1, SAS, 72 GB, OK)
Run Code Online (Sandbox Code Playgroud)

hpacucli 控制器插槽=1 显示

Smart Array P400 in Slot 1
   Bus Interface: PCI
   Slot: 1
   Serial Number: xxxx
   Cache Serial Number: xxxx
   RAID 6 (ADG) Status: Disabled
   Controller Status: OK
   Chassis Slot:
   Hardware Revision: Rev D
   Firmware Version: 4.06
   Rebuild Priority: Medium
   Expand Priority: Medium
   Surface Scan Delay: 15 secs
   Post Prompt Timeout: 0 secs
   Cache Board Present: True
   Cache Status: OK
   Accelerator Ratio: 100% Read / 0% Write
   Drive Write Cache: Disabled
   Total Cache Size: 256 MB
   Battery Pack Count: 0
   SATA NCQ Supported: True
Run Code Online (Sandbox Code Playgroud)

运行这一系列命令是否安全?

hpacucli controller slot=1 array A remove drives=1:8
hpacucli controller slot=1 pd 1:8 modify led=on
Run Code Online (Sandbox Code Playgroud)

使用远程手卸下驱动器并更换。然后运行:

hpacucli controller slot=1 array A add drives=1:8
Run Code Online (Sandbox Code Playgroud)

这会让阵列安全重建吗?

Cho*_*er3 10

您只需拉出死盘并更换它即可 - 根本不需要操作系统参与。


sys*_*138 7

运行这些命令是安全的。镜像组可以在没有一个磁盘的情况下继续存在。它应该自动重建,但如果不是,您已经确定的命令将启动它。

  • @ User70139 SmartArray 卡足够智能,可以停止写入故障前的磁盘并启动故障指示灯闪烁。I/O 已被卡停顿。驱动器仍在旋转,但未使用磁头。如果您担心,在拉出旧驱动器时,请将其拉​​出一英寸并等待 10 秒钟,然后再将其完全拉出。 (2认同)
  • 只要您的 HP 磁盘带有红色手柄,它们就兼容热插拔,并且可以随时从服务器中取出,即使在旋转时也是如此。显然,在它有 10 到 15 秒的时间停止盘片旋转之前,您不想甩动它。事实上,永远不要甩他们,你应该没事的。驱动器重建/更换是控制器的责任,您无需担心在拉出故障驱动器之前或之后执行任何命令。这一切都发生在堆栈的更深处。 (2认同)

eww*_*ite 5

具有预故障的驱动器不一定有 LED 指示灯(有时它是缓慢的琥珀色闪烁),因此为智能手识别它是一个好主意。不过,您不需要从阵列中移除驱动器或重新添加它。这些功能将由控制器自动处理。您所需要的只是hpacucli controller slot=1 pd 1:8 modify led=on线路。