监控 gke 上的 CPU/mem 使用情况

VsM*_*VsM 3 kubernetes google-kubernetes-engine

我最近在生产中推出了 gke 和 kubernetes。我有没有明显原因的定期中断。没有事件显示任何内容,pod 没有重新启动并且看起来很稳定。我有一个类似的 qa env,它完全没有问题,但它要小得多。

我在哪里可以找到有关中断原因的潜在信息?

Ray*_*oss 6

堆栈驱动程序让你支付和配置它...... kubernetes 为它提供了一个工具......只需使用这个:

kubectl top nodes

al@host:~/$ kubectl top nodes
NAME                             CPU(cores)   CPU%      MEMORY(bytes)   MEMORY%
gke-learn-pool-1-10f60e0a-s44c   104m         11%       1008Mi          86%
Run Code Online (Sandbox Code Playgroud)

您也可以在集群-> 集群-> 节点-> 节点下

在此处输入图片说明

更新:Stack Driver 弃用了所有负载监控插件。现在是 K8s 或高速公路。