如何实现Amazon RDS的多可用区部署?

cip*_*hor 12 amazon-rds

最近我正在考虑将Amazon RDS Multi-AZ部署用于生产环境中的服务,并且我已经阅读了相关文档.

但是,我对故障转移有疑问.在Amazon RDS的常见问题解答中,故障转移描述如下:

问:多可用区故障转移期间会发生什么以及需要多长时间?

Amazon RDS会自动处理故障转移,以便您可以在没有管理干预的情况下尽快恢复数据库操作.当故障转移时,Amazon RDS只是将数据库实例的规范名称记录(CNAME)翻转为指向备用数据库,而备用数据库又被提升为新的主数据库.我们建议您遵循最佳实践并在应用程序层实施数据库连接重试.故障转移时间是完成崩溃恢复所需时间的函数.从头到尾,故障转移通常在三分钟内完成.

从上面的描述中,我猜必须有一个监控服务,可以检测主要实例的故障并进行翻转.

我的问题是,哪个AZ监控服务主机在哪?有三种可能性:1.与主要相同的AZ 2.与备用数据库相同的AZ 3.另一个AZ

显然1和2不会是这种情况,因为它无法处理整个AZ不可用的情况.那么,如果是3,那么如果监控服务的AZ发生故障怎么办?是否有其他服务来监控此监控服务?它似乎是一个无尽的多米诺骨牌.

那么,亚马逊如何确保多可用区部署中RDS的可用性?

小智 0

有根据的猜测 - 监控服务在所有可用区上运行,并引用正在运行的实例的共享列表(跨可用区同步复制)。一旦一个可用区上的监控服务发现另一个可用区已关闭,它就会将所有正在运行的实例的 CNAMES 翻转到当前已启动的可用区。