HP MSA70 / P800 阵列故障 - 显示每个插槽中有 2 个驱动器,13/25 个驱动器“丢失”

NXT*_*guy 3 hp hp-modular-smart-array

我们有一个带有 25 x 600GB HP SAS 10k DP 驱动器的 HP MSA70,连接到 HP P800 控制器。驱动器配置为 RAID 6。

昨天,发生了某种未知的“事件”,阵列掉线了。我们重新启动了服务器(运行 CENTOS 6.2),在启动时,阵列控制器报告 13 个驱动器“丢失”。当我们查看阵列管理中的卷时,插槽 1-12 的每个插槽都有两个条目。一个显示 600gb 驱动器,一个显示 0gb 驱动器。12 点之后没有更多条目。

我们联系了 HP 支持,后者将我们送到了第 2 层支持,但几个小时后放弃了。他们说他们以前从未见过这个(我最喜欢从供应商那里听到的话)。

有没有人以前见过这个,我们是否丢失了所有数据?

谢谢你。

eww*_*ite 5

旧的,旧的,旧的,旧的……

  • CentOS 6.2 较 (6.2,2011 年 12 月 6 日(内核 2.6.32-220))
  • HP StorageWorks MSA70 是旧的(生命终结 - 2010 年 10 月)
  • HP Smart Array P800 是旧的(生命终结 - 2010 年)

所以这让我觉得固件和驱动程序也很旧。例如,没有理由在 2015 年运行 CentOS 6.2...而且我假设没有努力保持任何最新状态。

这也让我认为系统没有受到监控。假设是 HP 服务器硬件,系统 IML 日志说了什么?您是否正在运行 HP 管理代理?否则,可能会错过有关服务器和存储健康状况的重要消息。

您是否检查了 HP Array Configuration Utility(或HP SSA)中的信息?

但最终,您可能遇到了端口故障或扩展器/背板故障:

  • 多少 SAS 电缆连接到机柜?如果连接了 1 根电缆,则您可能会因为机柜中的 SAS 扩展器而遇到背板问题。
  • 如果连接了两条电缆,则可能是 SAS 电缆、MSA70 控制器或 P800 端口出现故障。

您的数据可能完好无损,但您需要隔离问题并确定上述问题中的哪一个是罪魁祸首。更换 SAS 电缆比更换 MSA70 控制器或 RAID 控制器卡要容易得多……但我想您可以在 eBay 上花 40 美元购买另一个 MSA70……