如果只有 1 个硬盘出现故障,RAID 4 磁盘设置是否会崩溃?

Ste*_*gue 9 raid

我是一名网络开发人员。我在硬件方面没有太多经验。出于这个原因,我使用托管服务器。

今天早上,我们设置中的一个驱动器出现故障。但是,整个网站都崩溃了。我问我的网络主机发生了什么,他回答说硬盘出现故障,RAID 控制器无法正常工作。阵列设置为 RAID 4。

你们以前见过吗?是否可以?

感谢您对这些家伙的任何帮助。我需要知道我的网络主机是否对我诚实。

Chr*_*s S 22

很可能您的提供商使用的硬盘驱动器不打算在 RAID 中使用。普通消费者 SATA 驱动器属于这一类。

可能的问题是驱动器开始出现不可纠正的读取错误 (URE)。当这种情况发生在消费者驱动器中时,驱动器会坐在那里并重试读取操作(通常持续 30-60 秒),直到它放弃。RAID 将等待驱动器报告错误(30-60)秒。因此,对几个扇区的简单请求很容易导致服务器停止,而故障驱动器则通过这些读取重试操作进行研磨。

用于 RAID 阵列的驱动器具有限时错误恢复(对于 SATA 驱动器)。TLER 快速向控制器报告故障,以便控制器可以智能地响应此类故障(主要是智能的;希望如此)。SCSI(SAS 也是)的工作方式略有不同。SCSI 命令集允许控制器指定驱动器上的各种恢复工作限制 (MODE SELECT: RW ERR RECOVERY)。RAID 控制器应该将驱动器设置为快速失效,然后控制器可以测试驱动器是否认为它使用 TUR 命令正常工作,如果存在检查条件,则将驱动器从阵列中排除。


lon*_*eck 11

是的,这是可能的,即使在您认为阵列应该在故障中幸存下来的情况下也是如此。

关于数组失败的一些可能性:

  • 出现故障的驱动器数量超过了 RAID 模式所能承受的范围。例如:
    • RAID 0(条带化)无法承受任何驱动器故障。
    • RAID 1 可以承受除 1 个驱动器之外的所有故障。
    • RAID 4/5 可以承受 1 个驱动器故障。
    • RAID 6 可以承受 2 次驱动器故障。
    • RAID 10 可以承受多达 50% 的驱动器故障,具体取决于哪些驱动器发生故障。
  • RAID 软件或控制器固件中的错误。
  • 用户错误。
    • 有人拉了太多驱动器。
    • 有人拔了一个驱动器却没有更换它,另一个驱动器随后出现故障。
    • 阵列不受监控,导致更多驱动器发生故障而无法幸存。
  • 众所周知,带有消费级驱动器的廉价控制器即使在其他可生存的情况下也会出现故障。
    • 消费级驱动器将几乎无限期地尝试读取坏扇区,直到读取良好为止。便宜的控制器将几乎无限期地等待此类驱动器返回结果。等待时间可能很长,以至于操作系统放弃。然后在重新启动时,驱动器对控制器的响应不够快,并且假定阵列出现故障。
    • 另一方面,企业级驱动器会很快放弃,允许控制器从另一个驱动器中提取数据。此外,一个好的控制器会将一个需要很长时间才能响应的驱动器标记为失败并继续前进。


joe*_*rty 8

如果它是 RAID 0 实现,那么当单个驱动器出现故障时,您肯定会丢失阵列及其所有数据。

  • 哈哈哈 - 你差点让我在那里,这到底是什么? (11认同)
  • @Chopper3 NetApp 使用 RAID4。所以这并非完全闻所未闻,尽管它也让我发笑。也许这是主持人说他们有 NetApp Filer 或其他东西的方式。 (3认同)