The*_*uck 5 redis redis-sentinel
我正在尝试跨 3 个节点设置 Redis/Sentinel 设置,每个节点都运行一个 redis 实例和一个哨兵实例。然而,当主机宕机时,剩下的哨兵只是坐在那里什么都不做,然后决定将每个从机设置为自己的从机,这当然接近于可能的更坏的行动方案。
有关设置的详细信息如下:
节点是10.66.5.3
, 10.66.5.4
, 10.66.5.5
。
默认情况下,.3
节点是主节点(在安装时),所有其他节点在/etc/redis/redis.conf
文件中都有相应的条目:slaveof 10.66.5.3 6379
. 其余部分redis.conf
未修改。
哨兵的起始配置如下:
daemonize no
sentinel monitor myapp 10.66.5.3 6379 2
sentinel down-after-milliseconds myapp 5000
sentinel failover-timeout myapp 15000
sentinel parallel-syncs myapp 1
Run Code Online (Sandbox Code Playgroud)
注意:我让upstart
处理服务,这就是守护进程标志关闭的原因。配置文件可由它们各自的守护进程写入,因此哨兵可以(并且确实)更新其配置文件,例如,没问题。
只要所有节点都活着,设置就可以正常工作。在 master 上注册一些东西会传播到 slave 等等。
现在,当我当时选择关闭 ( shutdown -h now
) Redis master 并留出一些时间让 quorum 发生时,产生的情况是:
.4
被设置为他的 IP 地址的从属 ( 10.66.5.4
).5
被设置为从属127.0.1.1
哨兵正在做很多来回的尝试来选择东西,但在其中一个坏掉后显然无法彼此正确沟通。他们还不断发现自己情绪低落和其他荒谬的事情。
1744:X 12 May 17:02:32.453 # -odown master myapp 127.0.1.1 6379
1744:X 12 May 17:02:33.517 # +odown master myapp 127.0.1.1 6379 #quorum 2/2
1744:X 12 May 17:02:38.139 # +sdown slave 10.66.5.5:6379 10.66.5.5 6379 @ myapp 127.0.1.1 6379
1744:X 12 May 17:02:38.358 # +sdown slave 10.66.5.4:6379 10.66.5.4 6379 @ myapp 127.0.1.1 6379
1744:X 12 May 17:02:42.970 # -sdown slave 10.66.5.5:6379 10.66.5.5 6379 @ myapp 127.0.1.1 6379
1744:X 12 May 17:02:43.203 # -sdown slave 10.66.5.4:6379 10.66.5.4 6379 @ myapp 127.0.1.1 6379
1744:X 12 May 17:02:43.230 * -dup-sentinel master myapp 127.0.1.1 6379 #duplicate of 127.0.0.1:26379 or 3369dfeed7f6e970c4620b3689741b47ba5d9972
1744:X 12 May 17:02:43.230 * +sentinel sentinel 127.0.0.1:26379 127.0.0.1 26379 @ myapp 127.0.1.1 6379
1744:X 12 May 17:02:43.280 # -odown master myapp 127.0.1.1 6379
1744:X 12 May 17:02:43.313 * -dup-sentinel master myapp 127.0.1.1 6379 #duplicate of 10.66.5.4:26379 or 3369dfeed7f6e970c4620b3689741b47ba5d9972
1744:X 12 May 17:02:43.313 * +sentinel sentinel 10.66.5.4:26379 10.66.5.4 26379 @ myapp 127.0.1.1 6379
1744:X 12 May 17:02:44.123 # +new-epoch 24
1744:X 12 May 17:02:44.125 # +vote-for-leader 3369dfeed7f6e970c4620b3689741b47ba5d9972 24
1744:X 12 May 17:02:44.409 # +odown master myapp 127.0.1.1 6379 #quorum 2/2
Run Code Online (Sandbox Code Playgroud)
继续运行:
我不太确定那里发生了什么,而且我已经没有想法了。
归档时间: |
|
查看次数: |
2422 次 |
最近记录: |