集群升级后,三个主节点之一无法连接回集群。我有一个 HA 集群在 us-east-1a、us-east-1b 和 us-east-1c 中运行,在 us-east-1a 中运行的 master 无法重新加入集群。
我尝试将 master-us-east-1a 实例组缩小到零个节点,然后将其恢复到一个节点,但 EC2 机器启动时出现同样的问题,无法再次加入到集群,似乎是从备份启动的或者其他的东西。
我尝试连接到master来重新启动服务,可能是protukube或docker,但我也无法解决问题。
通过主服务器中的 ssh 连接,我注意到 flannel 服务没有在这台机器上运行。我尝试通过 docker 手动运行但没有成功。看来 flannel 是应该运行的网络服务,但没有运行。
提前致谢。
附件
> kubectl get nodes
NAME STATUS ROLES AGE VERSION
ip-xxx-xxx-xxx-xxx.ec2.internal Ready node 33d v1.11.9
ip-xxx-xxx-xxx-xxx.ec2.internal Ready master 33d v1.11.9
ip-xxx-xxx-xxx-xxx.ec2.internal Ready node 33d v1.11.9
ip-xxx-xxx-xxx-xxx.ec2.internal Ready master 33d v1.11.9
ip-xxx-xxx-xxx-xxx.ec2.internal Ready node 33d v1.11.9
Run Code Online (Sandbox Code Playgroud)
-
> sudo systemctl status kubelet
Jan 10 …Run Code Online (Sandbox Code Playgroud)