我有四个 PostgreSQL 9.5 实例在 EC2 上运行,使用 m4.8xlarge 实例,RAID0 设置中有五个 PIOPS SSD 和一个单独的 XLOG 驱动器。直到今天早上,我的复制延迟从未超过一两分钟,但现在复制在大约 30 分钟后在所有实例上完全失败。
重新启动 Postgres 将问题再解决半小时。
没有 CPU 争用,iowait 通常小于 1%。阻止对服务器的读取,认为它可能会不堪重负,什么也不做。我无法弄清楚这里的问题是什么,除了亚马逊的问题。
谁能给我一些想法如何解决这个问题?日志中没有任何内容,replay_location(来自 pg_stat_replication)只是停止更新,直到我重新启动从站。
postgresql performance postgresql-9.5 postgresql-performance