相关疑难解决方法(0)

3Ware RAID6 阵列有时会挂起。未检测到损坏的磁盘?

我们有一台 Debian 服务器,带有 3Ware 9650SE 8 驱动器 RAID 控制器,带有 5 个磁盘 RAID6 阵列,充当虚拟机主机,全部为 Linux。问题不断发生,我怀疑未检测到损坏的磁盘。

我们现在有几次崩溃,主机和所有客人都说 IO 系统阻塞了 120 秒或更长时间。我们怀疑 RAID 控制器有问题,但我们将其更换为具有相同固件的相同控制器,但没有修复。我不认为它会,因为第二个 RAID1 阵列保持正常工作。

大约一周前(周日),当这种情况发生时,自动验证为 66%。昨晚(星期五早上)是 67%。在启动之前和之后,以及在遇到问题时。当我用 关闭验证时tw_cli /c0/u0 stop verify,事情又变得响应了。

我怀疑它卡在大约 66% 的磁盘故障上。周六开始自动验证:

# tw_cli /c0 show verify
/c0 basic verify weekly preferred start: Saturday, 12:00AM
Run Code Online (Sandbox Code Playgroud)

并且通常会在周五之前完成。看到周日是 66%,周五是 67%,这不太可能是巧合。

所有驱动器上的“smartctl -a -d 3ware,0 /dev/twa0”和“smartctl -t long”(长时间的智能自检)都没有显示任何错误。也不行tw_cli /c0 show alarms

我怀疑磁盘以难以检测的方式损坏,但我将每个驱动器一个一个地从阵列中取出,从中创建了一个“单个”阵列,并添加了完整的零。没有磁盘显示错误。

或者有什么其他建议?

编辑:

这是布局:

# tw_cli /c0 show

Unit  UnitType  Status         %RCmpl  %V/I/M  Stripe  Size(GB)  Cache  AVrfy …
Run Code Online (Sandbox Code Playgroud)

3ware

13
推荐指数
1
解决办法
2726
查看次数

标签 统计

3ware ×1