除了交换文件之外,RAID 1/10 Mismatch_cnt > 0 的原因是什么?

Vla*_*sny 5 linux mdadm raid10

我的四台服务器中的两台目前拥有mismatch_cnt大约 40000 个服务器,这让我很担心。我们正在使用 RAID10 设置。手册指出,

然而,在 RAID1 和 RAID10 上,软件问题可能会导致报告不匹配。这并不一定意味着阵列上的数据已损坏。可能只是系统不关心数组的该部分存储了什么 - 它是未使用的空间。

我们的服务器上不使用任何交换文件。服务器的其中一个 HDD SMART 自检失败,Available_Reservd_Space 过低。托管提供商表示,只有在硬盘出现物理故障时才会更换硬盘。

我想我不明白这个参数的真正含义和用处。该参数具有如此大值的其他原因可能是什么?如果这是镜像阵列,系统怎么可能不关心阵列的该部分上有什么?出于安全考虑,我认为系统也应该同步可用空间,然后 - 还剩下什么?

有没有可靠的方法来估计服务器中特定硬盘的风险?

sho*_*hok 4

mismatch_cnt通常, RAID1/10 阵列上的高值有两个原因:

  • 在数组上交换
  • 非常快的文件创建/写入/重写/删除工作负载

上述原因是无害的:虽然它们确实指出了阵列中的差异(基本上是不同步的阵列),但它们与未使用的磁盘空间有关。

然而,还有一个更令人担忧和危险的mismatch_cnt原因:硬件问题(即:供电不一致的故障电源和/或磁盘 DRAM 芯片行为不当)可能会改变传输中的数据,导致两个磁盘之间出现许多不一致。

您可以在 linux-raid 邮件列表中找到有关此主题的更多信息。