GKE 监控,了解可移出和不可移出内存

edm*_*rto 5 google-cloud-platform google-kubernetes-engine

我这里有一张内存限制利用率的图表。据我了解,不可驱逐的无法回收,可驱逐的可以回收。鉴于我的不可驱逐使用量超出了我的限制,但有足够的可回收内存。我是否只得到平均值,这将是我的利用率?

在此输入图像描述

Aka*_*wal 2

参加聚会有点晚了,但我最终在类似的困惑中做了这样的事情:

  1. 我使用了度量标准node/memory/allocatable_utilization
  2. 过滤cluster_name(这可能是你真正想要的任何东西),
  3. 通过...分组node_name
  4. 聚合为sum,
  5. 最后将所有时间线的阈值设置为不高于。

这意味着,如果我所有节点的可分配 RAM 利用率都高于 90%,则意味着整个集群的 RAM 利用率高于 90%,这正是我想要跟踪的。:)

对于node/cpu/allocatable_utilization,您需要跳过步骤 3 和 4,因为没有evictablenon-evictableCPU 的概念。