小编Sou*_*kar的帖子

动物园管理员问题-如果领导人被杀,则需要15分钟才能恢复

即时通讯试图在我的网络中与zookeeper一起实施Kafka,但我正面临Zookeeper的怪异问题。我环顾了Google,并意识到许多其他用户都报告了此类问题,但没有人为此发布任何适当的解决方案。

我当前的设置有3个不同的zookeeper节点(32 GB的ram专用盒),问题是如果我杀死了zookeeper领导者,其余的跟随者节点也会掉线,并且至少在接下来的15-20分钟内无法恢复。

我在Zookeeper日志中得到的只是“通知超时”,没有任何解释

这是我的zookeeper配置文件

tickTime=2000
initLimit=10
syncLimit=5
maxClientCnxns=100
maxSessionTimeout=50000
dataDir=/var/lib/zookeeper
clientPort=2181
autopurge.snapRetainCount=100
autopurge.purgeInterval=1
preAllocSize=131072
snapCount=3000000

server.1=zo1:2888:3888
server.2=zo2:2888:3888
server.3=zo3:2888:3888
Run Code Online (Sandbox Code Playgroud)

在我的/ etc / hosts文件中,我已将zo1,zo2,zo3映射到其IP地址。

注意:我还通过将当前节点ip设置为0.0.0.0进行了测试,这没有任何区别。

就在几分钟前,我对其进行了测试,但再次无法恢复。因为我有三个节点群集zo1,zo2和zo3。zo3是领导者,zo1和zo2是关注者。在我杀死zo3节点之后。自动恢复大约需要13分钟。我在zo1和zo2中获得了以下日志。

登录zo1。

尾/var/lib/zookeeper/zookeeper.out -n 10000 | grep'QuorumPeer'

2019-01-02 10:25:50,848 [myid:1] - INFO  [QuorumPeer[myid=1]/0:0:0:0:0:0:0:0:2181:FollowerZooKeeperServer@140] - Shutting down
2019-01-02 10:25:50,848 [myid:1] - INFO  [QuorumPeer[myid=1]/0:0:0:0:0:0:0:0:2181:ZooKeeperServer@505] - shutting down
2019-01-02 10:25:50,848 [myid:1] - INFO  [QuorumPeer[myid=1]/0:0:0:0:0:0:0:0:2181:FollowerRequestProcessor@107] - Shutting down
2019-01-02 10:25:50,848 [myid:1] - INFO  [QuorumPeer[myid=1]/0:0:0:0:0:0:0:0:2181:CommitProcessor@184] - Shutting down
2019-01-02 10:25:50,848 [myid:1] - INFO  [QuorumPeer[myid=1]/0:0:0:0:0:0:0:0:2181:FinalRequestProcessor@402] - shutdown of request processor complete
2019-01-02 …
Run Code Online (Sandbox Code Playgroud)

distributed-computing apache-zookeeper

5
推荐指数
1
解决办法
523
查看次数