假设我正在尝试使用 Nagios 监控一个盒子,但是有一个失控的进程正在窃取计算机近 100% 的 CPU 和 RAM。在这种情况下,Nagios 如何继续提醒我有关框的状态?什么是阻止失控的进程也阻止 Nagios 运行?
如果受监控的服务器过载,Nagios 或任何其他监控程序将无法在该服务器上工作。
但是不用担心,您将收到宝贵的警报:您将认识到监视服务器的每个 Nagios 测试都会超时的情况。
虽然如果你的意思是你拥有所有东西,包括 Nagios,都在同一台服务器上运行,那么你的 Nagios 很容易突然死亡。始终有一个单独的监控服务器,否则监控将毫无用处:它会在您真正需要它的那一刻停止!
您还可以考虑安装一些信息丰富的监视器,例如平均负载。如果平均负载超过某个临界点,请让 Nagios 警告您。
使用 MRTG、Cacti 或 Nagiosgraph 绘制各种服务器方面(例如 CPU、内存和磁盘使用情况)的图表也很有帮助,让您更容易关注趋势。