小编Sou*_*kar的帖子

动物园管理员问题-如果领导人被杀，则需要15分钟才能恢复

即时通讯试图在我的网络中与zookeeper一起实施Kafka，但我正面临Zookeeper的怪异问题。我环顾了Google，并意识到许多其他用户都报告了此类问题，但没有人为此发布任何适当的解决方案。

我当前的设置有3个不同的zookeeper节点（32 GB的ram专用盒），问题是如果我杀死了zookeeper领导者，其余的跟随者节点也会掉线，并且至少在接下来的15-20分钟内无法恢复。

我在Zookeeper日志中得到的只是“通知超时”，没有任何解释

这是我的zookeeper配置文件

tickTime=2000
initLimit=10
syncLimit=5
maxClientCnxns=100
maxSessionTimeout=50000
dataDir=/var/lib/zookeeper
clientPort=2181
autopurge.snapRetainCount=100
autopurge.purgeInterval=1
preAllocSize=131072
snapCount=3000000

server.1=zo1:2888:3888
server.2=zo2:2888:3888
server.3=zo3:2888:3888

Run Code Online (Sandbox Code Playgroud)

在我的/ etc / hosts文件中，我已将zo1，zo2，zo3映射到其IP地址。

注意：我还通过将当前节点ip设置为0.0.0.0进行了测试，这没有任何区别。

就在几分钟前，我对其进行了测试，但再次无法恢复。因为我有三个节点群集zo1，zo2和zo3。zo3是领导者，zo1和zo2是关注者。在我杀死zo3节点之后。自动恢复大约需要13分钟。我在zo1和zo2中获得了以下日志。

登录zo1。

尾/var/lib/zookeeper/zookeeper.out -n 10000 | grep'QuorumPeer'

2019-01-02 10:25:50,848 [myid:1] - INFO  [QuorumPeer[myid=1]/0:0:0:0:0:0:0:0:2181:FollowerZooKeeperServer@140] - Shutting down
2019-01-02 10:25:50,848 [myid:1] - INFO  [QuorumPeer[myid=1]/0:0:0:0:0:0:0:0:2181:ZooKeeperServer@505] - shutting down
2019-01-02 10:25:50,848 [myid:1] - INFO  [QuorumPeer[myid=1]/0:0:0:0:0:0:0:0:2181:FollowerRequestProcessor@107] - Shutting down
2019-01-02 10:25:50,848 [myid:1] - INFO  [QuorumPeer[myid=1]/0:0:0:0:0:0:0:0:2181:CommitProcessor@184] - Shutting down
2019-01-02 10:25:50,848 [myid:1] - INFO  [QuorumPeer[myid=1]/0:0:0:0:0:0:0:0:2181:FinalRequestProcessor@402] - shutdown of request processor complete
2019-01-02 …

Run Code Online (Sandbox Code Playgroud)

distributed-computing apache-zookeeper

Sou*_*kar

lucky-day

5
推荐指数

1
解决办法

523
查看次数

标签统计

apache-zookeeper ×1

distributed-computing ×1

动物园管理员问题-如果领导人被杀，则需要15分钟才能恢复

标签 统计

小编Sou_kar的帖子

标签统计