我有几台由 munin 监控的服务器,并且相当频繁地,选择的单元之一在读取数据时出现瞬时故障。这给了我两封电子邮件,一封告诉我所有的值都是未知的,第二封五分钟后让我知道一切都好。
据我所知,munin 正在按照此处设计的方式运行,但我想知道是否有任何方法可以延迟发送一个更新周期的初始“未知”警报,因此不会报告瞬态未知数?我目前的所有设置都在训练我忽略警告邮件。
如果失败,有什么方法可以完全禁用发送“未知”警报及其相应的恢复警报?
我将我的 salt sls 文件存储在一个 git 存储库中,但我有一个长期存在的问题,即我无法验证我的 YAML 是否代表了一组可以应用的有效状态(我也很难验证我的 YAML -- 那是不过要容易得多)。理想情况下,我想要某种方式在提交之前在我的工作站上验证我的状态。如果做不到这一点,某种方式可以检查预接收挂钩,这样我至少可以阻止狡猾的代码访问服务器。