在 OOM 之后如何检测导致它的 pod?

Tim*_*ois 6 out-of-memory gcloud kubernetes

我在集群上运行一些 pod 时遇到了一些问题,我想知道在抛出异常后检测哪个 pod(和 rc)在我的节点上导致 OOM 的方法。我无法访问节点来检查日志,kubectl describe node也没有提供太多相关信息。

谢谢 :)

Pau*_*lMB 3

您是否尝试运行kubectl get events --watch来监控 k8s 上的事件并监控 podkubectl logs -f podname

  • 是的,通过这些事件,我可以看到 OOM,但我不知道哪个 pod 正在消耗内存。 (3认同)