SMART - 预测性故障计数

Bas*_*974 5 raid ibm drive-failure

我正在使用 MegaCLI 监控我的 IBM ServeRAID M5015 控制器的 RAID 状态,我在其中一个磁盘上有这个:

Enclosure Device ID: 252
Slot Number: 6
Enclosure position: 0
Device Id: 14
Sequence Number: 2
Media Error Count: 32
Other Error Count: 0
Predictive Failure Count: 18
Last Predictive Failure Event Seq Number: 8119
PD Type: SAS
Raw Size: 279.396 GB [0x22ecb25c Sectors]
Non Coerced Size: 278.896 GB [0x22dcb25c Sectors]
Coerced Size: 278.464 GB [0x22cee000 Sectors]
Firmware state: Online, Spun Up
SAS Address(0): 0x5000c50042c319c9
SAS Address(1): 0x0
Connected Port Number: 5(path0)
Inquiry Data: IBM-ESXSST9300653SS     B6336XN04HC10525B633
IBM FRU/CRU: 81Y9671
FDE Capable: Not Capable
FDE Enable: Disable
Secured: Unsecured
Locked: Unlocked
Needs EKM Attention: No
Foreign State: None
Device Speed: 6.0Gb/s
Link Speed: 6.0Gb/s
Media Type: Hard Disk Device
Drive:  Not Certified
Drive Temperature :33 Celsius
Run Code Online (Sandbox Code Playgroud)

这究竟是什么意思?我找不到确切的描述,有没有办法获得更多详细信息?RAID 阵列具有最佳状态。

媒体错误计数:32

预测性故障计数:18

有没有办法通过 CLI 打开前面的 LED 电源,这样我就知道我需要更换哪个磁盘?

eww*_*ite 8

您的磁盘上有错误。SMART代表自我监控、分析和报告技术

您提到的具体错误与驱动器的机械退化有关。您可以使用此报告从 IBM 获得保修更换。驱动器最终会失败。


Bas*_*974 5

来自希捷文档:

预测性故障

当驱动器在一段时间内表现不可接受时,SMART 会发出预测性故障信号。固件保持每个属性的错误率不可接受的次数的运行计数。为了实现这一点,每当错误率不可接受时计数器递增,并且每当错误率可接受时递减(不超过零)。如果计数器不断增加以达到预测阈值,则发出预测失败信号。这个计数器被称为失败

历史计数器。每个属性都有一个单独的故障历史计数器。

找出故障磁盘的位置如下:

MegaCli -PdLocate -start -physdrv\[E:S] -aA
Run Code Online (Sandbox Code Playgroud)
  • E : 外壳
  • S : 插槽
  • A : 适配器