我有一个 Nagios 系统,其中包含大量分类在不同主机组中的主机。这些主机中的每一个都有两个受监控的服务,其中一个旨在依赖于另一个 - 如果 service1 是 WARNING 或 CRITICAL,则该服务器上的 service2 也不应该发出警报。service2 更多地用于统计收集,而 service1 是一个简单的可用性检查 - 因此,我总是希望 service2 检查,但如果 service1 报告为关闭,则不会发出警报。
这是我的 services.cfg 条目:
define servicedependency{
hostgroup example-servers
#host_name host1.example.com,host2.example.com
service_description service1
dependent_service_description service2
execution_failure_criteria n
notification_failure_criteria u,w,c,o
}
Run Code Online (Sandbox Code Playgroud)
我已经尝试通过主机组和单个服务器的列表来指定它。理想情况下,我会将整个主机组放在一起,而不必经常维护一个列表。
但是,无论哪种方式,这似乎都不起作用。如果 service1 已关闭,service2 还会在问题屏幕和主机详细信息中显示 CRITICAL 状态。
小智 0
来自 Nagios 手册中的“execution_failure_criteria”:“如果指定 n(无)作为选项,则执行依赖性将永远不会失败,并且将始终主动检查依赖服务的检查(如果其他条件允许)。”
听起来您应该使用“u,c”(不要检查 server1 是否未知或关键)。或者也许是“w,u,c”,如果来自 service1 的警告状态也会导致 service2 不执行。
归档时间: |
|
查看次数: |
4825 次 |
最近记录: |