使用 prometheus 监控 docker - 不同容器的 cpu 使用情况看起来相同

Question

使用 prometheus 监控 docker - 不同容器的 cpu 使用情况看起来相同

tgo*_*gos 1 monitoring cpu-usage docker grafana prometheus

我的设置：

普罗米修斯服务器
2 个节点出口商
格拉法纳

docker-compose.yml

version: '2'

services:

  prometheus_srv:
    build: ./prom_serv
    image: prom/prometheus
    container_name: prometheus_server
    hostname: prometheus_server

  prometheus_node:
    image: prom/node-exporter
    container_name: prom_node_exporter
    hostname: prom_node_exporter
    depends_on:
      - prometheus_srv

  prometheus_node2:
    image: prom/node-exporter
    container_name: prom_node_exporter2
    hostname: prom_node_exporter2
    depends_on:
      - prometheus_node

  grafana:
    image: grafana/grafana
    container_name: grafana_server
    hostname: grafana_server
    depends_on:
      - prometheus_node2

Run Code Online (Sandbox Code Playgroud)

Prometheus 服务器的 Dockerfile：

FROM prom/prometheus
ADD prometheus.yml /etc/prometheus/

Run Code Online (Sandbox Code Playgroud)

普罗米修斯.yml

# Load and evaluate rules in this file eve
scrape_configs:
  # Scrape Prometheus itself
  - job_name: 'prometheus'
    scrape_interval: 10s
    scrape_timeout: 10s
    static_configs:
      - targets: ['localhost:9090']

  # Scrape the Node Exporter
  - job_name: 'node'
    scrape_interval: 10s
    static_configs:
      - targets: ['prom_node_exporter:9100']

  # Scrape the Node Exporter2
  - job_name: 'node2'
    scrape_interval: 10s
    static_configs:
      - targets: ['prom_node_exporter2:9100']

Run Code Online (Sandbox Code Playgroud)

将 Prometheus 数据源添加到 Grafana 后，我添加了一个新仪表板，其中包含 2 个 CPU 使用情况图，每个节点导出器一个：

100 - (avg by (instance) (irate(node_cpu{job="node",mode="idle"}[5m])) * 100)
100 - (avg by (instance) (irate(node_cpu{job="node2",mode="idle"}[5m])) * 100)

Run Code Online (Sandbox Code Playgroud)

并尝试为第一个节点导出器生成 CPU 峰值，如下所示：

docker container exec -it prom_node_exporter sh
/ # dd if=/dev/zero of=/dev/null

Run Code Online (Sandbox Code Playgroud)

我最终发现这两个图看起来非常相似：

我认为使用命令的容器的 CPU 使用率应该高得多。这里出了什么问题？有什么建议么？

Answer 1

ahu*_*us1 6

我假设您在同一主机上运行所有容器。节点导出器将导出主机信息 - 因此两个节点导出器将显示有关一台主机的相同信息。

要收集有关容器的 CPU 使用情况的信息，请使用cAdvisor：它将允许您收集每个容器的 CPU 使用情况。

您应该为每台主机运行一个 cAdvisor 来收集有关主机上容器的信息，并为每台主机运行一个节点导出器来收集有关主机的信息。

归档时间：	8 年，8 月前
查看次数：	4646 次
最近记录：	8 年，8 月前