小编bsi*_*ngr的帖子

如何自动测试Prometheus警报?

我们即将设置Prometheus用于监控和警报我们的云服务,包括Prometheus服务的连续集成和部署管道以及警报规则/阈值等配置.为此,我正在考虑3个类别,我想编写自动化测试:

  1. 部署期间配置的基本语法检查(我们已经使用promtoolamtool执行此操作)
  2. 在部署期间测试警报规则(导致警报的原因)
  3. 在部署期间测试警报路由(谁会收到有关什么的警报)
  4. 重复检查警报系统是否在生产中正常工作

我现在最重要的部分是测试警报规则(类别1),但我没有找到工具来做到这一点.我可以想象在部署期间设置一个Prometheus实例,为它提供一些公制样本(担心我将如何使用普罗米修斯的Pull架构?)然后针对它运行查询.

到目前为止我唯一发现的是一篇关于监控普罗米修斯Alertmanager连锁店整个与第三类相关的博客文章.

有没有人做过这样的事情,还是有什么我错过的?

continuous-integration alert integration-testing automated-tests prometheus

10
推荐指数
1
解决办法
2938
查看次数