我们有一个 Zabbix 环境,我们试图通过安装在每个位置的代理来监控客户网络上的系统。许多客户站点共享相同的 IP 范围,这似乎是 Zabbix 的一个问题。
我们遇到了一个问题,受监控的主机在代理之间跳来跳去。当一切正常时,主机看起来像:
但出于某种原因,该站点的 server3.office.wolpertinger.com 主机被分配给 aardvark 的代理:
(这发生在几个不同的主机上,但为了诊断目的,我选择专注于这个特定的主机)
这个问题的最终结果是,zabbix server 在为代理构建配置时,可能没有包含所有必要的主机信息,以便代理可以正确监控代理。
例如,服务器在发送到 wolpertinger 的代理时将无法包含有关 server3.office.wolpertinger.com 的信息,然后突然该服务器被标记为无法访问一个小时。
我试过了:
都没有效果。
我需要做什么来解决这个问题?
aardvark 的发现规则状态:
发现规则的监控页面:
(你可以看到 zabbix 是如何对它看到的主机感到困惑,尽管发现规则被设置为通过 system.uname 来区分)
wolpertinger 的发现规则状态:
发现规则的监控页面:
发现动作规则:
各个主机的实际主机配置是:
注意:这里的代理应该是 wolpertinger
和:
有一次我意识到 Windows 不使用 system.uname 中的 FQDN,所以我认为它可能在主机之间是相同的:
server2.office.aardvark.com: Windows SERVER2 6.1.7601 Microsoft Windows 7 Professional Service Pack 1 x86
server3.office.ostrich.com: Windows SERVER3 6.1.7600 Microsoft Windows Server 2008 R2 Standard Edition x64
server2.office.ostrich.com: Windows SERVER2 6.1.7600 Microsoft Windows Server 2008 R2 Standard Edition x64
server3.office.wolpertinger.com: Windows SERVER3 6.1.7601 Microsoft Windows 7 Professional Service Pack 1 x64
server2.office.wolpertinger.com: Windows SERVER2 6.0.6002 Microsoft Windows Server 2008 Standard Edition Service Pack 2 x86
Run Code Online (Sandbox Code Playgroud)