小编rel*_*els的帖子

丢失系列/数据的警报

我试图了解如何在不再抓取指标时让 Grafana 提醒我。

我在这个例子中使用的指标是mongodb_instance_uptime_seconds. 当实例出现故障时,不再生成指标,导致 Prometheus 中缺少指标。目前警报在 上触发when last() query(A, 1m, now) < 600。如您所见,目标是在正常运行时间低于 5 分钟时发出警报。这意味着我想提醒重新启动和停止,但 Grafana 不会在一个实例关闭时发出警报,因为该last()值实际上不存在,并且当实例关闭超过 5 分钟时,它甚至不再报告。

关于如何前进的任何线索?

grafana prometheus

5
推荐指数
2
解决办法
5351
查看次数

标签 统计

grafana ×1

prometheus ×1