相关疑难解决方法(0)

如何用普罗米修斯计算kubernetes中容器的cpu使用情况作为监控?

我想计算kubernetes集群中所有pod的cpu使用情况.我在prometheus中发现了两个指标可能很有用:

container_cpu_usage_seconds_total: Cumulative cpu time consumed per cpu in seconds.
process_cpu_seconds_total: Total user and system CPU time spent in seconds.

Cpu Usage of all pods = increment per second of sum(container_cpu_usage_seconds_total{id="/"})/increment per second of sum(process_cpu_seconds_total)
Run Code Online (Sandbox Code Playgroud)

但是,我发现每秒的增量都container_cpu_usage{id="/"}大于增量sum(process_cpu_seconds_total).因此使用量可能大于1 ...

kubernetes prometheus

19
推荐指数
4
解决办法
3万
查看次数

Prometheus - 将cpu_user_seconds转换为CPU使用率%?

目前我正通过Prometheus.io监控码头集装箱.我的问题是我只是得到"cpu_user_seconds_total"或"c​​pu_system_seconds_total".我的问题是如何将这个不断增加的值转换为CPU百分比?

目前我在查询:

rate(container_cpu_user_seconds_total[30s])
Run Code Online (Sandbox Code Playgroud)

但我不认为它是正确的(与顶部相比).

如何将cpu_user_seconds_total转换为CPU百分比?(就像在顶部)

performance cpu-usage performance-testing prometheus

14
推荐指数
3
解决办法
3万
查看次数

什么是暂停容器?

在我的IBM Cloud Private中,我看到了几个暂停容器。

谁能解释这些目的?通常,我可以在正在运行的容器中访问bash外壳,但不能进入正在暂停的容器。

# docker ps | grep pause
ee5f3f6b9fc0        ibmcom/pause:3.0    "/pause"                 About an hour ago   Up About an hour                        k8s_POD_catalog-catalog-apiserver-8qxrf_kube-system_3b4b107d-0b72-11e8-9f22-005056227136_0
d238dad0c5b8        ibmcom/pause:3.0    "/pause"                 About an hour ago   Up About an hour                        k8s_POD_auth-apikeys-bk28g_kube-system_3b731880-0b72-11e8-9f22-005056227136_0
0196efb043ca        ibmcom/pause:3.0    "/pause"                 About an hour ago   Up About an hour                        k8s_POD_icp-router-htnhz_kube-system_3b8d25d3-0b72-11e8-9f22-005056227136_0
b09dc1759d09        ibmcom/pause:3.0    "/pause"                 About an hour ago   Up About an hour                        k8s_POD_unified-router-bskb6_kube-system_3af9d44e-0b72-11e8-9f22-005056227136_0
8a392f174c24        ibmcom/pause:3.0    "/pause"                 About an hour ago   Up About an hour                        k8s_POD_auth-pap-gfh7q_kube-system_3aa5b311-0b72-11e8-9f22-005056227136_0
0ac776eb9ced        ibmcom/pause:3.0    "/pause"                 About an hour ago   Up About an …
Run Code Online (Sandbox Code Playgroud)

docker ibm-cloud-private

7
推荐指数
4
解决办法
6610
查看次数

如何在Kubernetes中使用Prometheus获得pod的(milli)核心CPU使用率?

我运行了v1.9.2Kubernetes 的自定义设置,并使用Prometheus抓取了各种指标v2.1.0。除其他外,我抓了kubeletcAdvisor指标。

我想回答这个问题:“ 如何通过定义的CPU资源的多少requestslimits?在我的部署实际上是在使用中(毫)内核方面荚(及其容器)

有许多可用的刮除指标,但并非如此。也许可以通过以秒为单位的CPU使用时间来计算,但是我不知道如何。

我一直在考虑这是不可能的-直到一个朋友告诉我她在集群中运行Heapster时,内置Grafana中有一个图形准确地表明:它在(milli)内核中显示pod及其容器的单个CPU使用情况。

由于Heapster还使用kubeletcAdvisor度量,所以我想知道:我该如何计算?InfluxDB中的指标已命名,cpu/usage_rate但是即使使用Heapster的代码,我也无法弄清楚他们如何计算它。

任何帮助表示赞赏,谢谢!

kubernetes prometheus

7
推荐指数
2
解决办法
4065
查看次数

Prometheus 查询以获取 kubernetes pod 中的 CPU 和内存使用情况

我需要使用 prometheus 查询获取 kubernetes pod 中的 CPU 和内存使用情况。有人可以帮忙吗?

grafana kubernetes prometheus promql

6
推荐指数
2
解决办法
1万
查看次数

按部署名称排列的container_memory_usage_bytes

给定一个 kubernetes 集群:

  1. 普罗米修斯
  2. 节点导出器
  3. kube 状态指标

我喜欢使用度量container_memory_usage_bytes,但选择 bydeployment_name而不是pod

只要没有部署,像container_memory_usage_bytes{pod_name=~"foo-.+"}if 这样的选择器就很棒。deployment_name=foodeployment_name=foo-bar

我想用 metric 实现同样的目标kube_pod_container_resource_limits_memory_bytes

有办法实现这一点吗?

metrics kubernetes prometheus

4
推荐指数
1
解决办法
2万
查看次数

如果泊坞窗容器停止则发出警报

我正在使用Prometheus,cAdvisor和Prometheus Alertmanager监控几个容器.我想要的是在容器出于某种原因出现故障时收到警报.问题是如果容器死了,cAdvisor没有收集任何指标.任何查询都返回"无数据",因为查询没有匹配项.

prometheus cadvisor

3
推荐指数
1
解决办法
7874
查看次数

prometheus 查询连续正常运行时间

我是 prometheus 的新手,一直在尝试找出正确的查询,以获得我的服务的最后连续正常运行时间。

例如,如果当前时间是 0:01:20,我的服务在 0:00:00 启动,在 0:01:01 关闭并在 0:01:10 再次启动,我想看到“10 秒”的正常运行时间。

我主要关注“up{}”指标,并可能将其与函数(changes()、rate() 等)结合起来,但到目前为止还没有运气。我也没有看到任何其他类似于“up”的普罗米修斯指标。

metrics continuous prometheus

1
推荐指数
1
解决办法
5474
查看次数