在 mdadm softraid 6(大约 12 个磁盘,60TB)上,大文件(>100GB)中出现了意外的误写。检查了所有系统 - RAM、NIC、LSI RAID 卡。最怀疑的是LSI,因为它的电池BBU没电,写回/直写设置不正确。理论上,每个数据块都使用 XOR 冗余备份,RAID5 1x,RAID 6 2x。但这仅在某些活动磁盘出现故障时才会起作用。
在 mdadm 中是否有一个命令可以在考虑 XOR 备份的情况下启动完整的数据一致性检查?这意味着我可以识别误写的块吗?
在我丢弃 BBU 后,我想知道哪些文件是好的,哪些文件已损坏,必须更换。如果没有办法解决它,我应该从头开始创建阵列并从他们的备份中获取所有文件。