RAID 自动重新同步?

std*_*err 14 mdadm synchronization

我相当随机地检查了我的 RAID 阵列的状态cat/proc/mdstat并意识到,我的一个阵列似乎正在重新同步:

md1 : active raid1 sdb7[1] sdc7[0]
      238340224 blocks [2/2] [UU]
      [==========>..........]  resync = 52.2% (124602368/238340224) finish=75.0min speed=25258K/sec
Run Code Online (Sandbox Code Playgroud)

这是为什么?它是什么意思?我似乎可以通过权限访问挂载点r/w

编辑 1(响应SLM 的 ANSWER

如果我grep通过dmesg,我真的看不到任何东西,而且--detail开关也没有告诉我太多信息,即它显示重新同步正在进行中......但没有提示原因或可能不同步的原因.. . - 我想我可能只需要在开始更换硬件之前密切关注它。

slm*_*slm 11

这似乎表明 RAID 的 2 个成员之间的同步彼此不保持同步。

1. 调查日志

我会调查您的dmesg日志,看看是否有任何消息表明构成该阵列的任何一个物理 HDD 出现硬件故障。

2. 检查 mdadm

您还可以mdadm使用--detail开关进行咨询以了解有关重新同步的更多信息,如下所示:

$ sudo mdadm --detail /dev/md0
/dev/md0:
        Version : 00.90.03
  Creation Time : Sat Jan 26 09:14:11 2008
     Raid Level : raid1
     Array Size : 976759936 (931.51 GiB 1000.20 GB)
  Used Dev Size : 976759936 (931.51 GiB 1000.20 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Fri Jan  1 01:29:16 2010
          State : clean, resyncing
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

 Rebuild Status : 50% complete

           UUID : 37a3bfcb:41393031:23c133e6:3b879f08
         Events : 0.2178969

    Number   Major   Minor   RaidDevice State
       0       8        1        0      active sync   /dev/sda1
       1       8       17        1      active sync   /dev/sdb1
Run Code Online (Sandbox Code Playgroud)

如果两个设备看起来都很好,而您无法确定哪个设备有问题,您可能需要临时对每个 HDD 运行诊断工具,例如 HDAT2 或 SpinRite,以确认它们的健康状况。

3. 布线

如果硬盘检查出来,那么我会开始检查布线,我通常会换掉这些。

4. 控制器

接下来,我会仔细检查控制器本身,要么将驱动器从受影响的系统中取出并在辅助系统中对其进行诊断,要么将第 3 方控制器卡添加到受影响的系统中以进一步诊断问题。

5. 电源

信不信由你,我过去曾遇到过 HDD 和 RAID 的问题,其中更换故障或即将出现故障的电源解决了我的 RAID 运行状况问题。


小智 11

检查您的 cron 文件,许多发行版每周都会进行一次预定的重新同步/重新检查。

在 CentOS 7.1 上,它位于 /etc/cron.d/raid-check

# Run system wide raid-check once a week on Sunday at 1am by default
0 1 * * Sun root /usr/sbin/raid-check
Run Code Online (Sandbox Code Playgroud)

配置行为编辑 /etc/sysconfig/raid-check

  • @frostschutz ...除非是一个月的第一个星期日:http://serverfault.com/a/255549/299551 在这种情况下,强制重新同步。 (4认同)