How to get max cpu useage of a pod in kubernetes over a time interval (say 30 days) in promql?

mad*_*boy 2 kubernetes prometheus promql prometheus-operator

我正在尝试估计资源 (cpu) 请求和限制值,为此我想使用 prometheus 了解过去一个月 pod 的最大 cpu 使用率。

我检查了这个问题,但无法得到我想要的从 Prometheus 查询中的返回值生成范围向量

我试过了,但似乎 max_over_time 并没有超速工作

max (  
  max_over_time(
    rate(
      container_cpu_usage_seconds_total[5m]
    )[30d]
  )
) by (pod_name)
Run Code Online (Sandbox Code Playgroud)

无效参数“查询”:字符 64 处的解析错误:范围规范必须以度量选择器开头,但要跟在 *promql.Call 之后

eka*_*rak 6

您需要捕获内部表达式(容器 cpu 使用率)作为记录规则

- record: container_cpu_usage_seconds_total:rate5m
  expr: rate(container_cpu_usage_seconds_total[5m])
Run Code Online (Sandbox Code Playgroud)

然后使用这个新的时间序列来计算 max_over_time:

max (  
  max_over_time(container_cpu_usage_seconds_total:rate5m[30d])
) by (pod_name)
Run Code Online (Sandbox Code Playgroud)

这仅在 2.7 之前的 Prometheus 版本中需要,因为可以即时计算子查询有关更多详细信息,请参阅此博客文章

但请记住,如果您打算使用此复合查询(过去 30 天内收集的最大数据的 max_per_time)进行警报或可视化(而不是一次性查询),那么您仍然希望使用记录规则以提高查询的性能。它是经典的 CS 计算复杂度权衡(将记录规则存储为单独的时间序列所需的内存/存储空间与处理 30 天数据所需的计算资源!)