虚假 RAID 控制器故障。是我的控制器坏了还是我的磁盘坏了?

jsp*_*jsp 2 raid dell-perc

我有一台带有 PERC H710P 的戴尔 T7500,连接到 RAID5 阵列中的 4 个 3T 驱动器。控制器还连接了 2 个 256G SSD 驱动器,未配置在阵列中。Linux 服务器安装在其中一个 SSD 驱动器上,RAID5 是存储我所有用户数据的地方。

前几天启动时,RAID BIOS 报告错误

Drives 01 and 03 missing
Foreign config available
Run Code Online (Sandbox Code Playgroud)

我加载了外部配置,驱动器重新出现。在下一次启动时,我得到了

Drive 01 offline
Run Code Online (Sandbox Code Playgroud)

认为驱动器坏了,我用新驱动器替换它并重建驱动器 01。当我下次启动时,系统运行正常,但几次重启后我得到了

Drive 00 offline
Foreign config available
Run Code Online (Sandbox Code Playgroud)

所以我阅读了外国配置并强制在线00。

经过几次重新启动后,我得到了

Drive 03 offline
Foreign config available
Run Code Online (Sandbox Code Playgroud)

读入外部配置。强制驱动器 03 在线。

现在系统就OK了。我已经重启过很多次了。

我应该假设我的控制器是坏的吗?

或者换一种说法,这种行为是否有可能是由控制器以外的其他原因引起的?例如,内核驱动程序能否以某种方式破坏驱动程序配置?

小智 5

是的,我相信您的控制器或 raid 背板坏了。但我认为控制器是罪魁祸首。您能否查找 RAID 控制器的固件版本(不要与系统 BIOS 混淆,您还应该检查它)并与戴尔网站上提供的版本进行比较?您可能会发现该版本很旧,并且在较新的版本中已经解决了关键问题。或者,您可以尝试致电戴尔支持 - 如果有支持,您当然应该这样做!您可以通过在 support.dell.com 上查找服务标签来轻松查看有效的服务合同。

两个注意事项。你在危险的领域。升级 RAID 控制器固件有时会导致数据丢失 - 确保新版本已经发布一段时间,并仔细阅读发行说明。2) RAID 5 没有给你很大的回旋余地。无论哪种方式,请准备好备份您的关键数据,然后再让时间解决这个问题或采取任何实质性的纠正措施!