Mil*_*oke 4 haproxy mesos prometheus
我正在处理一项需要配置和验证 prometheus 警报管理器的任务。当 mesos 进程和 HAProxy 进程关闭时,用户应该收到警报,我试图在互联网上找到这些警报规则,但没有找到合适的。谁能告诉我如何为这些编写警报规则。基本上需要条件条款。
这取决于您如何监控事物。让我们以 HAProxy 为例,假设您正在使用 HAProxy 导出器 ( https://github.com/prometheus/haproxy_exporter ) 来监视它。HAProxy 导出器包含一个名为 的指标haproxy_up,它表明它是否成功抓取了 HAProxy(当 Prometheus 反过来抓取导出器时)。如果 HAProxy 无法被抓取,haproxy_up将有一个值,0您可以对此发出警报。假设您的 HAProxy 导出器的 Prometheus 作业名称为haproxy-exporter. 然后,您可以编写这样的警报规则:
ALERT HAProxyDown
IF haproxy_up{job="haproxy-exporter"} == 0
FOR 5m
LABELS {
severity = "page"
}
ANNOTATIONS {
summary = "HAProxy {{ $labels.instance }} down",
description = "HAProxy {{ $labels.instance }} could not be scraped."
}
Run Code Online (Sandbox Code Playgroud)
如果超过 5 分钟无法抓取任何 HAProxy 实例,这将发送警报。
如果您想知道导出器(而不是 HAProxy 本身)是否已关闭,您可以改为使用该表达式up{job="haproxy-exporter"} == 0来查找任何已关闭的 HAProxy 导出器实例。可能你实际上想要检查两者。
我不能说太多关于 Mesos 和它的出口商,因为我对他们没有任何经验,但我想它会是类似的。
| 归档时间: |
|
| 查看次数: |
2617 次 |
| 最近记录: |