我正在尝试在munin设置一些新主机进行监控.由于某种原因,它没有发生!
这是我到目前为止所尝试的内容.
在已经监控其他几台主机的munin服务器上,我在/etc/munin/munin.conf中添加了我想要的主机
[db1]
address 10.10.10.25 # <- obscured the real IP address
use_node_name yes
Run Code Online (Sandbox Code Playgroud)
在db1主机上,我在/etc/munin/munin-node.conf中设置了这个
host_name db1.example.com
allow ^127\.0\.0\.1$
allow ^10\.10\.10\.26$
allow ^::1$
port 4949
Run Code Online (Sandbox Code Playgroud)
我确保在两台机器上重启服务.
从监控主机我可以telnet到我要在munin端口上监控的新服务器:
[root@monitor3:~] #telnet db1.example.com 4949
Trying 10.10.10.26...
Connected to db1.example.com.
Escape character is '^]'.
# munin node at db1.example.com
Run Code Online (Sandbox Code Playgroud)
等几分钟......什么都没有!新服务器不会出现在munin监控主机上的munin仪表板中.
在db1主机(我正在尝试监控的那个)上的/var/log/munin/munin-update.log日志中,我发现:
2015/11/30 03:20:02 [INFO] starting work in 14199 for db1/10.10.10.26:4949.
2015/11/30 03:20:02 [FATAL] Socket read from db1 failed. Terminating process. at /usr/share/perl5/vendor_perl/Munin/Master/UpdateWorker.pm line 254.
2015/11/30 03:20:02 [ERROR] Munin::Master::UpdateWorker<db1;db1> died with '[FATAL] Socket read from db1 failed. Terminating process. at /usr/share/perl5/vendor_perl/Munin/Master/UpdateWorker.pm line 254.
Run Code Online (Sandbox Code Playgroud)
这可能会发生什么?我该如何解决这个问题?
既然您已经验证了您的网络连接正常,作为调查的第一步,我肯定会简化munin-node.conf. 目前您有:
host_name db1.example.com
allow ^127\.0\.0\.1$
allow ^10\.10\.10\.26$
allow ^::1$
port 4949
Run Code Online (Sandbox Code Playgroud)
我将从这些中删除:
host_name(这可能是多余的。)allow如果仍然无法正常工作,您可以通过将直接 IP 替换为以下内容来完全排除配置的任何问题:
cidr_allow 10.10.10.0/24
Run Code Online (Sandbox Code Playgroud)
这将允许来自全范围 IP 的连接,以防您的 db1 主机似乎从不同的 IP 进行连接。
| 归档时间: |
|
| 查看次数: |
3648 次 |
| 最近记录: |