标签: monitoring

使用 prometheus 监控 docker - 不同容器的 cpu 使用情况看起来相同

我的设置:

  • 普罗米修斯服务器
  • 2 个节点出口商
  • 格拉法纳

docker-compose.yml

version: '2'

services:

  prometheus_srv:
    build: ./prom_serv
    image: prom/prometheus
    container_name: prometheus_server
    hostname: prometheus_server

  prometheus_node:
    image: prom/node-exporter
    container_name: prom_node_exporter
    hostname: prom_node_exporter
    depends_on:
      - prometheus_srv

  prometheus_node2:
    image: prom/node-exporter
    container_name: prom_node_exporter2
    hostname: prom_node_exporter2
    depends_on:
      - prometheus_node

  grafana:
    image: grafana/grafana
    container_name: grafana_server
    hostname: grafana_server
    depends_on:
      - prometheus_node2
Run Code Online (Sandbox Code Playgroud)

Prometheus 服务器的 Dockerfile:

FROM prom/prometheus
ADD prometheus.yml /etc/prometheus/
Run Code Online (Sandbox Code Playgroud)

普罗米修斯.yml

# Load and evaluate rules in this file eve
scrape_configs:
  # Scrape Prometheus itself
  - job_name: 'prometheus'
    scrape_interval: 10s
    scrape_timeout: 10s
    static_configs:
      - …
Run Code Online (Sandbox Code Playgroud)

monitoring cpu-usage docker grafana prometheus

1
推荐指数
1
解决办法
4646
查看次数

普罗米修斯 - 目标连接被拒绝

我正在尝试使用 Prometheus 容器从 cAdvisor 抓取指标。

这是我的 prometheus.yml:

global:
  scrape_interval: 10s
  evaluation_interval: 10s

scrape_configs:
 - job_name: "prometheus"
   static_configs:
     - targets: ["localhost:9090"]

 - job_name: "docker"
   static_configs:
     - targets: ['localhost:9323']

 - job_name: "cadvisor"
   scrape_interval: 5s
   static_configs:
     - targets: ['localhost:7070']
       labels:
         alias: "cadvisor"
Run Code Online (Sandbox Code Playgroud)

还有我的 docker-compose.yml:

version: "3.5"

services:
  app:
    container_name: app
    build: "./app"
    restart: always
    volumes:
      - ./app:/app
    depends_on:
      - db
    links:
      - db
    ports:
      - 8080:8080
  db:
    container_name: db
    image: postgres
    restart: always
    volumes:
      - ./data/postgres:/var/lib/postgresql/data
    environment:
      - POSTGRES_DB=articlesdb
      - POSTGRES_USER=dbuser 
      - POSTGRES_PASSWORD=dbpassword …
Run Code Online (Sandbox Code Playgroud)

monitoring docker docker-compose prometheus cadvisor

1
推荐指数
1
解决办法
9601
查看次数

如何使用 Telegraf 监控远程系统指标?

我会很感激一些关于如何构建堆栈telegraf + InfluxDB + Grafana以监控一组机器的建议。

我的场景

我已经telegraf + InfluxDB + Grafana在一台我称之为“监控实例”的机器上成功安装了堆栈。

我的系统是一个 API,由一台运行 nodejs 的机器和一个 postgres 实例组成。

我可以从我的 Postgresql 数据库(使用 postgres 的 Telegraf 输入插件)和我的应用程序(我以 prometheus 格式公开一些指标,telegraf 使用 prometheus 输入插件提取)中收集指标。

我的问题和疑惑

  • 监控节点和 postgres 实例的系统指标(cpu、mem 等)的最佳方法是什么?我应该在这台机器上安装 Telegraf 代理吗?
  • 如何将本地数据发送到“监控实例”?
  • 本地电报代理应该直接写入 influxdb 还是应该将指标发送到安装在“监控实例”中的 Telefraf?

提前致谢。

monitoring influxdb grafana telegraf

1
推荐指数
1
解决办法
4375
查看次数

如何从节点本身检查 Kubernetes 节点的状态?

从 Kubernetes 集群中的主节点,我可以运行kubectl get nodes并查看集群上任何单个节点的状态,因为kubectl可以找到用于身份验证的集群证书。在我的本地工作站上,假设我的身份验证配置正确,我也可以这样做。

加入到 Kubernetes master的节点,有没有什么方法可以配置身份验证以便kubectl工作,我可以识别节点是处于Ready还是Not Ready状态?

我正在尝试构建一些驻留在节点本身上的监控工具,我想避免设置服务帐户等只是为了检查节点状态,以防万一我可以通过某种方式识别它kubelet、日志、节点上某处的文件、命令等...

monitoring kubernetes kubectl

1
推荐指数
1
解决办法
3665
查看次数

如何更改 kubectl top 的间隔?

我想知道如何更改kubectl top监视 Pod 的时间间隔。目前它的更新速度非常慢(我认为超过 15 秒),我希望获得 pod 资源使用情况的最新值。

我知道我可以使用其他一些工具,例如 grafana、prometheus 等。但是当我在终端中工作时,我喜欢在同一环境中运行一些简单的监控工具。

monitoring kubernetes kubectl kubernetes-pod

1
推荐指数
1
解决办法
1万
查看次数

java vm:如何记录类卸载

我无法在这里找到使用 Java VM (JVM) 参数来记录类卸载的 Web 搜索工作方式。

这里http://www.herongyang.com/JVM/ClassLoader-JVM-Option-verbose-class.html建议调用java -verbose:class -version,但据说是为了加载,并且只给出了加载的日志。

关于Java HotSpot VM 选项

-XX:-TraceClassUnloading 跟踪类的卸载。-XX:-TraceClassLoading 跟踪类的加载。

java -XX:-TraceClassUnloading -version 不输出有关课程的信息:

[0.004s][warning][arguments] -XX:-TraceClassUnloading is deprecated. Will use -Xlog:class+unload=off instead.
java version "13" 2019-09-17
Java(TM) SE Runtime Environment (build 13+33)
Java HotSpot(TM) 64-Bit Server VM (build 13+33, mixed mode, sharing)
Run Code Online (Sandbox Code Playgroud)

和:

java -XX:-TraceClassLoading -version
[0.002s][warning][arguments] -XX:-TraceClassLoading is deprecated. Will use -Xlog:class+load=off instead.
java version "13" 2019-09-17
Java(TM) SE Runtime Environment (build 13+33)
Java HotSpot(TM) 64-Bit …
Run Code Online (Sandbox Code Playgroud)

java monitoring jvm jvm-hotspot

1
推荐指数
1
解决办法
2097
查看次数

如何在现有的 docker 容器上安装 Prometheus 节点导出器?

我有 3 个节点在单独的 Docker 容器中运行,我想使用 Prometheus 监控它们。我已经部署了带有 Prometheus 服务器的 docker 容器,但需要在容器中安装节点导出器以将指标导出到服务器。这些容器是使用 Ubuntu 映像构建的,并且在每个容器中运行一个 .jar。

  1. 如何在已经运行的容器上安装节点导出器二进制文件?
  2. 如何确保重启后自动安装node exporter?

monitoring docker prometheus prometheus-node-exporter

1
推荐指数
1
解决办法
5736
查看次数

OpenTracing 和 Zipkin 之间的主要区别是什么?

我正在研究分布跟踪工具。

发现有两个很受欢迎。

它们之间的主要区别是什么?您会推荐哪一款?您会推荐其他开源分布式跟踪工具吗?

monitoring zipkin opentracing distributed-tracing

1
推荐指数
1
解决办法
1851
查看次数

Prometheus Probe CRD 不探测目标

我正在使用 Prometheus Probe CRD 和 Blackbox 导出器来抓取静态目标。但是,当我检查 Blackbox Exporter 时,我根本没有看到指定的目标被探测。

我能够使用 Blackbox 导出器和 Prometheus 导出器值文件中的additionalScrapeConfigs 来探测目标,但它不能与 Probe CRD 一起使用。

这是我的探针自定义对象配置,

kind: Probe
metadata:
  name: probe-crd
  namespace: prometheus
spec:
  jobName: probe-crd
  prober:
    url: prometheus-blackbox-exporter:9115
  targets:
    staticConfig:
      static:
      - https://www.google.com
Run Code Online (Sandbox Code Playgroud)

Blackbox 导出器服务正在端口 9115 上运行。有人可以让我知道我在这里缺少什么吗?

monitoring kubernetes prometheus prometheus-operator prometheus-blackbox-exporter

1
推荐指数
1
解决办法
4389
查看次数

如何知道一个进程是否已经启动但是在Linux中崩溃了

请考虑以下情况: - 我正在使用Linux.我怀疑我的应用程序崩溃了.我没有启用核心转储.日志中没有信息.

我怎么能确定,在系统重新启动后我的应用程序启动了,但现在它没有运行,因为它已经崩溃了.

我的应用程序配置为服务,用C/C++编写.

在某种程度上:如何获得自系统启动以来执行的所有进程/服务名称?它甚至可能吗?

我知道,我可以启用日志记录并再次启动进程以获取崩溃.

c c++ linux debugging monitoring

0
推荐指数
2
解决办法
4879
查看次数