更换服务器中 8 个驱动器中的 3 个

-7 dell hardware-raid raid5 sql-server-2008 dell-poweredge

我们有一台运行 SQL 2008 R2 的 Dell R510 服务器,带有 8 个运行 Raid 5 的 300GB 驱动器。

我们(刚刚注意到)我们有三个指示灯闪烁的坏驱动器,所以我们关闭了服务器并用新的替换了它们。

当服务器恢复时,指示灯为绿色(但不闪烁)。

服务器只显示 XXXX GB 的空间,所以它没有读取驱动器,我们是否错过了将新驱动器联机的步骤?

raid 阵列需要时间来构建还是应该一次交换一个?

我们有数据的副本,因此恢复它不是主要问题。

eww*_*ite 17

你为什么要在网上问这个?

这里的WTF太多了,我不知道从哪里开始!!

这个问题表明对硬件、RAID 阵列、存储、监控和一般 IT 最佳实践缺乏基本的了解。

我读了这个问题,不禁想到:

  • 谁实际负责此服务器硬件?系统管理员/顾问/IT 专业人员在哪里?

  • 为什么要关闭服务器来替换硬件 RAID 阵列中的热插拔磁盘?没有必要这样做,如果您已经怀疑磁盘有问题,它会大大增加您的风险。

  • 你明白“闪烁的灯”是什么意思吗?灯是什么颜色的?也许它们是在指示磁盘预故障而不是完全故障。

  • 您在不知道这样做的影响的情况下更换了驱动器。如果有的话,这些行为使情况变得更糟,您可能已经破坏了您的数据。

  • 为什么您希望在更换驱动器后磁盘阵列的大小会发生变化?“XXXX GB”到底是什么意思,为什么它与您的问题有关?如何传递诸如磁盘容量和类型以及呈现给操作系统的阵列大小之类的详细信息?

  • 刚刚注意到磁盘故障?您有可用的备用磁盘,但没有任何形式的监控来实际识别故障?你的服务器监控应该已经告诉你了。即使对服务器进行基本的目视检查也有助于识别问题。我怀疑磁盘同时发生故障。

  • 有没有人检查系统日志?当您启动系统时,硬件 RAID 控制器会说什么?Dell DRAC 日志说明了什么?操作系统说什么?

  • 最后,如果您对制造商支持的品牌硬件的操作有疑问,并且不明白发生了什么,那么评估您的情况(检查日志、数据和备份)并联系是否更有意义?戴尔

我理解技术的消费化意味着人们经常承担责任并处于他们不胜任的情况下,但这里展示的基本故障排除技能的缺乏令人震惊。不幸的是,人们为提供这种水平的服务而付费。


use*_*517 10

使用 RAID 5,您只能丢失 1 个磁盘并保持数据可用。您丢失了 3 个,因此您需要重建 RAID,然后从备份中恢复数据。

我们有一个关于RAID 级别的规范问答,可以帮助您理解。

  • @Pico *之前*发生的事情不再重要,*你*所做的事情已经搞砸了你的 RAID 阵列。 (8认同)
  • @Pico 我链接到的文档提供了有关各种 RAID 级别及其优势/劣势的相关信息。您选择使用哪个是业务决策。我不知道戴尔 R510(驱动器)上闪烁的灯意味着什么,但我知道现在您已经更换了 3 个驱动器,您的 RAID 5 已失效,需要重新创建并从备份中恢复数据。 (5认同)