标签: monitoring

Zabbix:“内存使用”和“内存利用率”之间的区别

最近开始使用Zabbix进行监控,有一个问题我自己想不通。:)“内存使用量”是“内存利用率”的反函数吗?我的“利用率”百分比很高,而“使用”百分比很低。

提前致谢。

ram monitoring zabbix

3
推荐指数
1
解决办法
1万
查看次数

分解一个 prometheus.yml 文件?

我使用 Prometheus 进行监控,并且有很多配置(我们的 prometheus.yml 主配置文件有 8000 多行长)。

我想将其分为逻辑分组,以便它变得更具可读性。我了解到 Prometheus 不支持此功能,我们可以使用 Ansible 等配置管理系统。

有人用他们的 Prometheus 配置文件做过这个吗?如果是这样,你是怎么做到的?

configuration monitoring configuration-management ansible prometheus

3
推荐指数
1
解决办法
4669
查看次数

Prometheus:合并二元运算中缺失标签的值

我有两个具有匹配标签的指标,两个计数器:

accounts_created_total{provider="auth0"} 738
accounts_created_total{provider="google} 980

accounts_deleted_total{provider="auth0"} 65
Run Code Online (Sandbox Code Playgroud)

我想根据这两个指标计算现有帐户的数量。我想出了这个:

accounts_created_total - accounts_deleted_total

# which results in

{provider="auth0"} 673

# Note the missing provider="Google"
Run Code Online (Sandbox Code Playgroud)

不幸的是,没有account_deleted_totalfor provider="Google",所以我只能得到结果provider="auth0"

有没有办法告诉普罗米修斯“弥补”丢失的标签?这通常相当于coalesceSQL 中的 a。

monitoring prometheus

3
推荐指数
1
解决办法
2493
查看次数

如何计算仪表指标的即时速率?

如何在不使用rate()或irate()的情况下计算Prometheus或Grafana中时间序列的每秒即时增长​​率?

此驱动功能无助于实现与 irate 相同的结果

irate(node_cpu_seconds_total[5m]) 

deriv(node_cpu_seconds_total_gauge[5m]) 
Run Code Online (Sandbox Code Playgroud)

实际上,我需要计算计量指标数据的时间序列的每秒瞬时增长率,这是一种修改后的计数器指标类型数据。

monitoring metrics wolfram-mathematica grafana prometheus

3
推荐指数
1
解决办法
8900
查看次数

Docker容器CPU使用率监控

根据 docker 的文档。\n我们可以使用docker stats命令获取 docker 容器的 CPU 使用情况。\nCPU % 列将给出容器正在使用的主机\xe2\x80\x99s CPU 的百分比。

\n

假设我限制容器使用 50% 的主机单个 CPU。我可以根据https://docs.docker.com/config/containers/resource_constraints/通过 --cpus=0.5 选项指定 50% 单 CPU 核心限制

\n

我们如何通过任何 docker 命令获取容器的 CPU% 使用率超出允许的 CPU 核心?\n例如 50% 的单 CPU 核心中,99% 已被使用。

\n

有什么办法可以用cadvisor或prometheus来获取它吗?

\n

performance monitoring docker prometheus cadvisor

3
推荐指数
1
解决办法
1万
查看次数

AttributeError:模块“google.cloud.monitoring_v3.types”没有属性“MetricDescriptor”

我正在运行一个脚本来在 gcp 上创建 GPU 指标并收到以下错误:

AttributeError: 'MetricServiceClient' object has no attribute 'project_path'

AttributeError: module 'google.cloud.monitoring_v3.types' has no attribute 'MetricDescriptor'
Run Code Online (Sandbox Code Playgroud)

monitoring gpu python-3.x google-compute-engine google-cloud-platform

3
推荐指数
1
解决办法
1960
查看次数

Prometheus 配置忽略 Kubernetes 中特定命名空间的指标抓取

有没有办法配置普罗米修斯忽略属于特定命名空间的所有资源的抓取指标?我无法通过阅读文档来弄清楚。

configuration monitoring kubernetes prometheus istio

3
推荐指数
1
解决办法
5834
查看次数

如何使用 telegraf 监控 systemd 服务?

我创建了一个在我们的系统中运行的 systemd 服务,我想使用已安装在实例上的 telegraf 代理来监视它。代理当前正在监视基本的基础设施,我需要向新服务添加监视。

我找不到任何关于如何做到这一点的示例,这很奇怪,我希望 telegraf 有某种用于基本功能的插件。

我的服务正在运行一个不公开任何端口的 python 脚本,因此我可以进行正常的 HTTP 运行状况检查。

任何帮助将不胜感激。

monitoring grafana telegraf

3
推荐指数
1
解决办法
3711
查看次数

使用 Loki 和 Promtail 解密 Grafana 中的 Docker 容器名称

我的任务是为大约 70 个容器配置 Docker 日志监控。将所有日志合并到一个面板中并不理想,尤其是在压力测试和监控 Docker 应用程序期间。我希望能够在面板中选择 Docker 容器应用程序并查看相应的日志。我已经实现了这一点,但问题是容器名称是加密的,我需要解密它们。

我的问题是:如何使用 Loki 数据源和 Promtail 解密容器名称?

此外,我注意到 Prometheus 数据源显示解密的容器名称,但 Loki 数据源则不显示。这是我对两者的配置:

另外,我像普通应用程序一样运行 Loki 和 Promtail,并配置了 systemd 守护进程。洛基:

auth_enabled: false

server:
  http_listen_port: 3100
  grpc_listen_port: 9096


ingester:
  lifecycler:
    address: 127.0.0.1
    ring:
      kvstore:
        store: inmemory
      replication_factor: 1
    final_sleep: 0s
  chunk_idle_period: 5m
  chunk_retain_period: 30s

schema_config:
  configs:
  - from: 2021-03-08
    store: boltdb
    object_store: filesystem
    schema: v11
    index:
      prefix: index_
      period: 24h

storage_config:
  boltdb:
    directory: /tmp/loki/index
Run Code Online (Sandbox Code Playgroud)

宣传尾声:

server:
  http_listen_port: 9080
  grpc_listen_port: 0

positions:
  filename: /tmp/positions.yaml

clients:
  - url: …
Run Code Online (Sandbox Code Playgroud)

monitoring docker grafana grafana-loki promtail

3
推荐指数
1
解决办法
1456
查看次数

使用bash/Perl中的RegEx从html表中提取值

我想用munin监视我的oki打印机,所以我试图让这个插件适应我的打印机.

我的打印机http服务器中的页面表是:

<table width="560" border="0" cellspacing="2" cellpadding="3">
    <tr class="sub_item_color">
        <td  class="normal" width="200" align="right" valign="bottom" rowspan="2">Media Size</td>
        <td  class="normal" width="90" align="left">Color</td>
        <td  class="normal" width="90" align="left">Color</td>
        <td  class="normal" width="90" align="left">Mono</td>
        <td  class="normal" width="90" align="left">Mono</td>
    </tr>
    <tr class="sub_item_color">
        <td  class="normal" width="90" align="left">A3/Tabloid</td>
        <td  class="normal" width="90" align="left">A4/Letter</td><td  class="normal" width="90" align="left">A3/Tabloid</td>
        <td  class="normal" width="90" align="left">A4/Letter</td>
    </tr>
    <tr class="sub_item_color">
        <td  class="normal" width="200" align="left">Total Impressions</td>
        <td  class="normal" width="90" align="right">21906</td>
        <td  class="normal" width="90" align="right">33491</td>
        <td  class="normal" width="90" align="right">2084</td>
        <td  class="normal" width="90" align="right">4460</td>
    </tr>
    <tr class="sub_item_color">
        <td …
Run Code Online (Sandbox Code Playgroud)

regex bash perl monitoring health-monitoring

2
推荐指数
1
解决办法
854
查看次数