除了交换文件之外，RAID 1/10 Mismatch_cnt > 0 的原因是什么？

Question

我的四台服务器中的两台目前拥有mismatch_cnt大约 40000 个服务器，这让我很担心。我们正在使用 RAID10 设置。手册指出，

然而，在 RAID1 和 RAID10 上，软件问题可能会导致报告不匹配。这并不一定意味着阵列上的数据已损坏。可能只是系统不关心数组的该部分存储了什么 - 它是未使用的空间。

我们的服务器上不使用任何交换文件。服务器的其中一个 HDD SMART 自检失败，Available_Reservd_Space 过低。托管提供商表示，只有在硬盘出现物理故障时才会更换硬盘。

我想我不明白这个参数的真正含义和用处。该参数具有如此大值的其他原因可能是什么？如果这是镜像阵列，系统怎么可能不关心阵列的该部分上有什么？出于安全考虑，我认为系统也应该同步可用空间，然后 - 还剩下什么？

有没有可靠的方法来估计服务器中特定硬盘的风险？

Answer 1

mismatch_cnt通常， RAID1/10 阵列上的高值有两个原因：

上述原因是无害的：虽然它们确实指出了阵列中的差异（基本上是不同步的阵列），但它们与未使用的磁盘空间有关。

然而，还有一个更令人担忧和危险的mismatch_cnt原因：硬件问题（即：供电不一致的故障电源和/或磁盘 DRAM 芯片行为不当）可能会改变传输中的数据，导致两个磁盘之间出现许多不一致。

您可以在 linux-raid 邮件列表中找到有关此主题的更多信息。

除了交换文件之外，RAID 1/10 Mismatch_cnt &gt; 0 的原因是什么？