RedShift节点故障转移

Question

我有一个包含4个节点的RedShift集群.

非常感谢!

Answer 1

如果是单节点故障 - 亚马逊将启动一个新节点并从其他节点流式传输数据(如果有的话,每个块都写入两个不同的节点).在这种情况下,我们可以期待:

如果多个节点出现故障,redshift将从最新的S3备份中恢复自身.S3备份在以下场合完成:

Answer 2

它恰好发生在我的集群上 - 其中一个节点失败了.在仪表板中花了差不多20分钟才注意到("性能"选项卡中显示不健康,但"状态"选项卡中显示健康状况).

从最初的故障开始1小时后,集群将其状态更改为"正在修改",并且在1小时后,新节点就位.

"最近事件"中有一条消息:

Amazon Redshift群集'xxx'上的节点在2013-12-18 11:42 UTC自动替换.群集现在正常运行.

整个时间集群都不可用 - 没有运行任何查询,也无法进行导入.

数据与失败时的数据完全相同.