Zabbix 服务器发送太多通知

ans*_*mdk 9 zabbix

我最近在 VPS 上安装了 Zabbix 服务器并且对它非常满意。我已经在 appr 上安装了客户端。6-7 个其他 VPS,一切正常。界面很流畅,它产生了一些非常漂亮的图形。
我对该软件的唯一问题是我已将其设置为发送问题通知,但我每天会收到 30 到 60 封电子邮件。总是出现“服务器 XXX 无法访问:问题”,一分钟后:“服务器 XXX 无法访问:OK”。当然,Zabbix 也能识别出真正的问题,例如当服务器重新启动时。在我看来,Zabbix 似乎非常快地“放弃”,或者可能比适合我的需要的超时更快。我一直试图用谷歌搜索这个问题好几次,但放弃了,所以现在我正在尝试这种方法。

有谁知道如何调整这些通知/触发器的保真度?

小智 9

https://www.zabbix.com/documentation/1.8/manual/escalations_and_repeated_notifications/delayed_notifications 我正在使用 Zabbix 的升级功能来抑制频繁的开/关消息。一般来说:

  • 第一条消息会触发升级链,无需向您发送电子邮件
  • 然后,Zabbix 在发送通知之前等待 5 分钟(或您设置的任何时间)。
  • 如果在这 5 分钟内触发状态更改为关闭,您将不会收到任何通知并且一切都会恢复正常。
  • 显示板仍然显示的好部分

奥列格


小智 5

您也可以调整触发器。我发现 count() 方法很方便。
而不是在 last(0) 上触发,而是尝试 count(300,0,"eq")}>5 。如果最后 5 次检查(假设检查之间间隔 60 秒)失败,则会触发异常。

http://www.zabbix.com/documentation/1.8/manual/config/triggers

您还可以通过添加 'Trigger value = "PROBLEM"' 条件来禁用 OK 消息。此更改应在操作配置中进行。

http://www.zabbix.com/documentation/1.8/manual/config/actions

  • 实际上,您的计数示例将返回过去 300 秒内等于 0 的值数。然后将其与 5 进行比较。总体效果是如果在过去 300 秒内出现 5 个或更多“0”值,则触发事件。 (2认同)