为什么在普罗米修斯中,increase()会返回1.33的值？

我们用时间序列图表sum(increase(foo_requests_total[1m]))来显示每分钟的foo请求数.请求很偶然 - 每天只有几个请求.图表中显示的值始终为1.3333.为什么价值不是1？在这一分钟内有一个请求.

prometheus

Jam*_*mes

lucky-day

9
推荐指数

2
解决办法

1814
查看次数

最近的价值或最后看到的价值

Prometheus是围绕返回指标的时间序列表示而构建的.在许多情况下,但是,我只关心什么度量的状态,现在,和我有一个很难搞清楚一个可靠的方式来获得一个度量的"最近"的价值.

从现在开始每隔30秒获得一次指标,我尝试过这样的事情:

my_metric[30s]

Run Code Online (Sandbox Code Playgroud)

但这感觉很脆弱.如果指标在数据点之间的日期多于或少于30秒,那么我要么得到多于一个或零结果.

如何获取指标的最新值？

prometheus

Cor*_*ein

lucky-day

9
推荐指数

5
解决办法

2万
查看次数

如何监控kubernetes持久卷的磁盘使用情况？

我有container_fs_usage_bytesprometheus监视容器根fs,但似乎cAdvisor中没有其他卷的指标.

kubernetes prometheus

hir*_*shi

lucky-day

9
推荐指数

3
解决办法

1万
查看次数

普罗米修斯/ PromQL减去两个指标

我有两个不同实例的衡量标准"metric_awesome".我想要做的是从实例2中减去实例一,就像这样

metric_awesome{instance="one"} - metric_awesome{instance="two"}

Run Code Online (Sandbox Code Playgroud)

不幸的是,结果集是空的.有没有人经历过这个？

prometheus

alk*_*ows

lucky-day

9
推荐指数

2
解决办法

3845
查看次数

如何通过配置设置 Prometheus Alertmanager 外部 URL

我正在使用 vanilla Docker 容器来启动 Alertmanager。据我所知，在这种情况下，我无法通过参数提供外部 URL，所以我必须找到另一种方式。

是否可以通过配置文件或环境变量设置 URL？

configuration prometheus prometheus-alertmanager

eve*_*zon

2020 02-28

9
推荐指数

3
解决办法

8639
查看次数

如何在 kubernetes 上配置由 helm 安装的警报管理器？

使用Helm已安装Prometheus并Grafana在 kubernetes 集群中：

helm install stable/prometheus
helm install stable/grafana

Run Code Online (Sandbox Code Playgroud)

它有一个alertmanage服务。

但是我看到一篇博客介绍了如何使用 yaml 文件设置 alertmanager 配置：

http://blog.wercker.com/how-to-setup-alerts-on-prometheus

是否可以使用当前方式（由 helm 安装）来设置 somealert rules和 config for CPU，memory并在不创建其他 yaml 文件的情况下发送电子邮件？

我看到了一个K8S介绍configmap到alertmanager：

https://github.com/kubernetes/charts/tree/master/stable/prometheus#configmap-files

但是不清楚怎么用，怎么做。

编辑

我下载了的源代码stable/prometheus来看看它的作用。从values.yaml我发现的文件中：

serverFiles:
  alerts: ""
  rules: ""

  prometheus.yml: |-
    rule_files:
      - /etc/config/rules
      - /etc/config/alerts
    scrape_configs:
      - job_name: prometheus
        static_configs:
          - targets:
            - localhost:9090

Run Code Online (Sandbox Code Playgroud)

https://github.com/kubernetes/charts/blob/master/stable/prometheus/values.yaml#L600

所以我认为应该自己写这个配置文件来定义警报rules和alertmanager这里。但不要清楚这个块：

    rule_files: …

Run Code Online (Sandbox Code Playgroud)

alert monitoring grafana kubernetes prometheus

onl*_*ine

2018 01-22

9
推荐指数

1
解决办法

9703
查看次数

背景截止日期超过 - 普罗米修斯

我有prometheus配置与许多工作,我正在通过http抓取指标.但我有一份工作,我需要通过https抓取指标.

当我访问:

https://开头的IP地址:端口/度

我可以看到指标.我在prometheus.yml配置中添加的工作是:

- job_name: 'test-jvm-metrics'
    scheme: https
    static_configs:
      - targets: ['ip:port']

Run Code Online (Sandbox Code Playgroud)

当我重新启动prometheus时,我可以看到我的目标上的错误:

背景截止日期已超过

我已经读过,scrape_timeout可能是问题所在,但是我把它设置为50秒仍然是同样的问题.

什么可能导致这个问题以及如何解决它？谢谢!

monitoring prometheus

xml*_*ser

lucky-day

9
推荐指数

3
解决办法

1万
查看次数

在 Prometheus/PromQL 中合并/加入两个指标

我有两个不同（但相关的指标）。

metric_1(id="abc",id2="def")
metric_2(id="abc",id2="def")

Run Code Online (Sandbox Code Playgroud)

我的最终目标是在 Grafana 中实现以下目标。我计划使用“即时”值和 Grafana 的表可视化小部件来显示这些数据。

id      id2     metric1 metric2
abc     def     1       2

Run Code Online (Sandbox Code Playgroud)

我应该使用什么查询/加入/重新标记来实现这一点？

先感谢您！:)

prometheus promql

rcj*_*uen

lucky-day

9
推荐指数

2
解决办法

1万
查看次数

为什么在 Prometheus 中使用 irate 或 rate 计算 CPU 利用率？

我知道 CPU 利用率是由非空闲时间占 CPU 总时间的百分比给出的。在普罗米修斯，rate或irate函数计算向量数组的变化率。

人们通常通过以下 PromQL 表达式来计算 CPU 利用率：

(100 - (avg by (instance) (rate(node_cpu_seconds_total{mode="idle"}[1m])) * 100))

Run Code Online (Sandbox Code Playgroud)

我不明白计算非空闲时间的每秒变化如何等同于计算 CPU 使用率。有人可以从数学上解释为什么这是有道理的吗？

prometheus

lxj*_*jhk

2019 10-21

9
推荐指数

1
解决办法

4749
查看次数

Prometheus 中是否提供详细日志？

我在 Kubernetes 中运行 Prometheus 并遇到一些 kube 状态指标连接错误。试图检查日志，但无法在日志中看到连接失败。无论如何，是否可以启用 Prometheus 的详细日志记录？

prometheus

use*_*872

2020 02-01

9
推荐指数

2
解决办法

1万
查看次数

标签统计

prometheus ×10

kubernetes ×2

monitoring ×2

alert ×1

configuration ×1

grafana ×1

prometheus-alertmanager ×1

promql ×1

标签: prometheus

编辑

标签 统计

标签统计