即时通讯试图在我的网络中与zookeeper一起实施Kafka,但我正面临Zookeeper的怪异问题。我环顾了Google,并意识到许多其他用户都报告了此类问题,但没有人为此发布任何适当的解决方案。
我当前的设置有3个不同的zookeeper节点(32 GB的ram专用盒),问题是如果我杀死了zookeeper领导者,其余的跟随者节点也会掉线,并且至少在接下来的15-20分钟内无法恢复。
我在Zookeeper日志中得到的只是“通知超时”,没有任何解释
这是我的zookeeper配置文件
tickTime=2000
initLimit=10
syncLimit=5
maxClientCnxns=100
maxSessionTimeout=50000
dataDir=/var/lib/zookeeper
clientPort=2181
autopurge.snapRetainCount=100
autopurge.purgeInterval=1
preAllocSize=131072
snapCount=3000000
server.1=zo1:2888:3888
server.2=zo2:2888:3888
server.3=zo3:2888:3888
Run Code Online (Sandbox Code Playgroud)
在我的/ etc / hosts文件中,我已将zo1,zo2,zo3映射到其IP地址。
注意:我还通过将当前节点ip设置为0.0.0.0进行了测试,这没有任何区别。
就在几分钟前,我对其进行了测试,但再次无法恢复。因为我有三个节点群集zo1,zo2和zo3。zo3是领导者,zo1和zo2是关注者。在我杀死zo3节点之后。自动恢复大约需要13分钟。我在zo1和zo2中获得了以下日志。
登录zo1。
尾/var/lib/zookeeper/zookeeper.out -n 10000 | grep'QuorumPeer'
2019-01-02 10:25:50,848 [myid:1] - INFO [QuorumPeer[myid=1]/0:0:0:0:0:0:0:0:2181:FollowerZooKeeperServer@140] - Shutting down
2019-01-02 10:25:50,848 [myid:1] - INFO [QuorumPeer[myid=1]/0:0:0:0:0:0:0:0:2181:ZooKeeperServer@505] - shutting down
2019-01-02 10:25:50,848 [myid:1] - INFO [QuorumPeer[myid=1]/0:0:0:0:0:0:0:0:2181:FollowerRequestProcessor@107] - Shutting down
2019-01-02 10:25:50,848 [myid:1] - INFO [QuorumPeer[myid=1]/0:0:0:0:0:0:0:0:2181:CommitProcessor@184] - Shutting down
2019-01-02 10:25:50,848 [myid:1] - INFO [QuorumPeer[myid=1]/0:0:0:0:0:0:0:0:2181:FinalRequestProcessor@402] - shutdown of request processor complete
2019-01-02 …Run Code Online (Sandbox Code Playgroud)