最近,我们在非生产和生产集群上都遇到了问题,其中节点遇到了“系统 OOM 遇到”问题。
非生产集群中的节点似乎没有共享 Pod。看起来某个给定的节点正在运行所有 Pod 并给系统带来负载。
此外,Pod 还停留在以下状态:“等待:ContainerCreating”。
对于上述问题的任何帮助/指导将不胜感激。我们正在这个集群中构建越来越多的服务,并希望确保不存在不稳定和/或环境问题,并在上线之前进行适当的检查/配置。
out-of-memory kubernetes
kubernetes ×1
out-of-memory ×1