我最近一直在研究 RAID5 与 RAID6,我一直看到 RAID5 不再足够安全,因为 URE 等级和驱动器的大小不断增加。基本上,我发现的大部分内容都说,在 RAID5 中,如果磁盘出现故障,如果阵列的其余部分为 12TB,那么您几乎有 100% 的机会遇到 URE 并丢失数据。
12TB 的数字来自这样一个事实,即磁盘的额定读取率为 10^14 位以达到一个 URE。
好吧,有些事情我没有得到。读取是由磁头在扇区上完成的,导致读取失败的原因是磁头死亡或扇区死亡。也可能是因为其他原因读数不起作用(我不知道,就像振动使头部跳动......)。所以,让我解决所有 3 种情况:
如您所见,从我确定的 3 个故障点来看,没有任何意义。那么到底什么是URE,我的意思是具体的?
有人可以向我解释一下吗?
编辑 1
在第一波答案之后,似乎原因是该部门失败了。好消息是固件、RAID 控制器和操作系统 + 文件系统有适当的程序来及早检测并重新分配扇区。
好吧,我现在知道什么是 URE(实际上,这个名字是不言自明的 :))。
我仍然对根本原因感到困惑,主要是他们给出的稳定评级。
有些人将失败的扇区归因于外部来源(宇宙波),然后我感到惊讶的是 URE 率是基于读取计数而不是年龄,宇宙波确实应该对旧磁盘产生更多影响,因为它已被暴露更多,我认为这更像是一种幻想,尽管我可能是错的。
现在是与磁盘磨损有关的另一个原因,有人指出较高的密度会产生较弱的磁畴,这是完全有道理的,我将遵循解释。但是正如这里很好地解释的那样,新的不同大小的磁盘主要是通过在 HDD 机箱中放置或多或少相同的盘片(然后相同的密度)来获得的。扇区是相同的,并且都应该具有完全相同的可靠性,因此较大的磁盘应该比较小的磁盘具有更高的评级,读取的扇区较少,情况并非如此,为什么?这虽然可以解释为什么采用新技术的新磁盘没有比旧磁盘获得更好的评级,仅仅是因为更好的技术收益被更高密度造成的损失所抵消。
在 Synology Disk Station 上规划我的 RAID 设置期间,我阅读了大量有关各种 RAID 类型的文章,这是一本很棒的读物:RAID 级别和URE(不可恢复的读取错误)的重要性。
但是,我还不清楚一件事:
让我们有两个场景:
两种情况的相同假设:
发生什么了?使用 99.999 个文件重建 RAID 是否正常而 1 个文件丢失?还是我会丢失所有 100.000 个文件?
如果答案需要文件系统类型的知识,假设它是 BTRFS 或 ZFS 作为文件系统。