不太熟悉用于刀片服务器设置的英特尔“镜像通道模式”(您在裸机刀片上运行的典型中等重型 MySQL OLTP 数据库;现在没有虚拟化)。
从英特尔文档中,我能够找到:
英特尔至强处理器 5500 系列和英特尔至强处理器 5600 系列支持通道镜像,以在镜像配置中配置 DDR3 DIMM 的可用通道。镜像配置是内存的冗余映像,尽管存在偶发的无法纠正的错误,但仍可继续运行。通道镜像是一种 RAS 功能,其中维护内存数据的两个相同映像,从而提供最大的冗余。
在基于英特尔至强处理器 5500 系列和英特尔至强处理器 5600 系列处理器的英特尔服务器主板上,实现了跨通道镜像。活动通道保存主映像,其他通道保存系统内存的次映像。英特尔至强处理器 5500 系列和英特尔至强处理器 5600 系列处理器中的集成内存控制器在两个通道之间交替进行读取事务。在正常情况下,写入事务会发送到两个通道。
但是,我并没有真正了解他们在这里放置的东西。我失去了一半的存储容量,但我获得了内存的“冗余”并可能获得读/写性能优势?像 RAM 的 RAID 1?有人对这种配置有任何实际经验吗?
“RAID 1 for RAM”是准确的描述。根据我的经验,没有太多的性能优势,但根据总线速度与模块的速度,您的里程可能会有所不同。
就冗余而言……好吧,模块坏的情况并不常见。
就个人而言,每当我看到它启用时,我都会关闭镜像。
就我个人而言,我会更早地使用某种形式的集群,而不是那种级别的硬件弹性。像磁盘这样的廉价组件在它们上加倍是有意义的,但镜像内存是一个很好的选择,但不是那么有用。我的意思是什么更有可能失败;CPU、您的操作系统、您的软件、您的主板、您的 PSU/s。我会早点把钱花在集群上。
我读到这种事情(你也可以用 CPU 来做)在巨大的超级计算机集群中非常有用。
其中一些集群运行的机器数量如此之多,以至于每隔几个小时就会发生一次机器故障。比作业完成的速度更快。这真的搞砸了计算。向每个节点添加这样的冗余可以使故障间隔时间增加一倍以上。