AWS EKS 工作线程节点“未就绪”

sta*_*kob 6 amazon-web-services kubernetes amazon-eks

我正在 AWS 上创建一个新的 EKS Kubernetes 集群。

当我部署工作负载(从现有集群迁移)时,Kubelet 停止发布节点状态,并且所有工作节点在一分钟内变为“NotReady”。

我假设集群内的错误配置不应导致节点崩溃 - 但显然确实如此。

集群内的错误配置真的会导致 AWS EKS 工作节点“未就绪”吗?在什么情况下会发生这种情况是否有一些经验法则?CPU 负载过高?kube 系统中的 Pod 崩溃?

Sam*_*m-T -4

您可以尝试kubectl describe node $BAD_NODE ssh 到节点并尝试sudo dmesg -T
节点上重新启动 kubelet/etc/init.d/kubelet restart

或者

systemctl restart kubelet
Run Code Online (Sandbox Code Playgroud)

或者删除节点(先排水)

kubectl drain <node-name>
kubectl delete node <node-name>
Run Code Online (Sandbox Code Playgroud)