std*_*err 14 mdadm synchronization
我相当随机地检查了我的 RAID 阵列的状态cat/proc/mdstat并意识到,我的一个阵列似乎正在重新同步:
md1 : active raid1 sdb7[1] sdc7[0]
238340224 blocks [2/2] [UU]
[==========>..........] resync = 52.2% (124602368/238340224) finish=75.0min speed=25258K/sec
Run Code Online (Sandbox Code Playgroud)
这是为什么?它是什么意思?我似乎可以通过权限访问挂载点r/w。
编辑 1(响应SLM 的 ANSWER)
如果我grep通过dmesg,我真的看不到任何东西,而且--detail开关也没有告诉我太多信息,即它显示重新同步正在进行中......但没有提示原因或可能不同步的原因.. . - 我想我可能只需要在开始更换硬件之前密切关注它。
slm*_*slm 11
这似乎表明 RAID 的 2 个成员之间的同步彼此不保持同步。
我会调查您的dmesg日志,看看是否有任何消息表明构成该阵列的任何一个物理 HDD 出现硬件故障。
您还可以mdadm使用--detail开关进行咨询以了解有关重新同步的更多信息,如下所示:
$ sudo mdadm --detail /dev/md0
/dev/md0:
Version : 00.90.03
Creation Time : Sat Jan 26 09:14:11 2008
Raid Level : raid1
Array Size : 976759936 (931.51 GiB 1000.20 GB)
Used Dev Size : 976759936 (931.51 GiB 1000.20 GB)
Raid Devices : 2
Total Devices : 2
Preferred Minor : 0
Persistence : Superblock is persistent
Update Time : Fri Jan 1 01:29:16 2010
State : clean, resyncing
Active Devices : 2
Working Devices : 2
Failed Devices : 0
Spare Devices : 0
Rebuild Status : 50% complete
UUID : 37a3bfcb:41393031:23c133e6:3b879f08
Events : 0.2178969
Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
1 8 17 1 active sync /dev/sdb1
Run Code Online (Sandbox Code Playgroud)
如果两个设备看起来都很好,而您无法确定哪个设备有问题,您可能需要临时对每个 HDD 运行诊断工具,例如 HDAT2 或 SpinRite,以确认它们的健康状况。
如果硬盘检查出来,那么我会开始检查布线,我通常会换掉这些。
接下来,我会仔细检查控制器本身,要么将驱动器从受影响的系统中取出并在辅助系统中对其进行诊断,要么将第 3 方控制器卡添加到受影响的系统中以进一步诊断问题。
信不信由你,我过去曾遇到过 HDD 和 RAID 的问题,其中更换故障或即将出现故障的电源解决了我的 RAID 运行状况问题。
小智 11
检查您的 cron 文件,许多发行版每周都会进行一次预定的重新同步/重新检查。
在 CentOS 7.1 上,它位于 /etc/cron.d/raid-check
# Run system wide raid-check once a week on Sunday at 1am by default
0 1 * * Sun root /usr/sbin/raid-check
Run Code Online (Sandbox Code Playgroud)
配置行为编辑 /etc/sysconfig/raid-check
| 归档时间: |
|
| 查看次数: |
37201 次 |
| 最近记录: |