就可靠性而言,Amazon EBS 驱动器上的 RAID 1 是否过大?

Sam*_*ani 7 amazon-ec2 amazon-ebs

我的想法是 RAID 1 在多个 EBS 驱动器上创建两个或多个数据副本。然而,Amazon EBS 磁盘实际上不是故障安全的,因为它们存在于多个物理驱动器上吗?那么就可靠性而言,添加 RAID 1 并没有获得太多收益。这是正确的还是我的事实错误?我意识到您可能仍会从 RAID 1 中获得读取性能优势。

Aar*_*own 18

是的,EBS 在后端具有容错能力,但 EBS 故障确实会以意想不到的方式发生。您不到的是我们大多数人都习惯的故障类型 - 驱动器坏了,只是彻底失败了。最常见的故障是延迟的巨大且不可预测的增加,这可能会使您的应用程序无响应。使用 RAID1 或 RAID 10 组,您可以简单地将有问题的驱动器从阵列中取出并更换为新驱动器,而无需停机。

回想几个月前的 ec2pocolypse,其中很大一部分 EBS 卷变得完全没有响应。我们这些拥有 RAID10 集的人能够通过使驱动器发生故障或使用 API 强制将其分离来轻松恢复。那些没有的(我正在看着你,reddit)不得不忍受不到一周的停机时间。

如果您真的关心您的数据,那么在任何情况下都不应该对它进行 RAID0。通过这样做,您增加了失败的可能性,同时降低了从失败中恢复的能力。快照很棒,但是除非您流式传输二进制日志(例如),否则您无法执行时间点恢复。如果您从事电子商务,当人们为最终没有发货的东西付款时会感到不安,因为数据库中不再有任何记录。

在经历了 EBS RAID 的又一次成功之后,我最近写了一篇关于 RAID10 EBS 的文章:http : //blog.9minutesnooze.com/raid-10-ebs-data/

问题是……您更信任谁的数据?亚马逊?还是你自己?


小智 4

在抽象的背后,驱动器已经是冗余的。为了提高速度,可以在 RAID 0 中运行它们。最佳方法是使用快照功能进行备份。在 RAID 上,这可以通过分解 RAID 或冻结卷、创建快照,然后将驱动器恢复正常使用来完成。或者,将数据写入单个 EBS 卷和快照也可以解决其他问题,例如实例故障,这可能使 RAID 驱动器处于不一致的状态,即使重新连接也是如此。

TL:博士;使用 RAID 1 太过分了,最好通过强大的备份为其他故障场景做好准备

  • 感谢你的回答。我忘记用我的研究结果来更新它。基本上,我所寻找的是这些 EBS 驱动器的年故障率为 0.5-1%。因此,您不能依赖亚马逊提供的冗余。然而,您也不能依赖使用 RAID 1,因为与典型的专用服务器相比,两个 EBS 驱动器的故障彼此之间的独立性要低得多。正如您提到的,最好的解决方案(除了定期备份之外)是频繁创建快照,如此处所述 https://forums.aws.amazon.com/thread.jspa?messageID=124224 (2认同)