我正在配置一个故障转移服务器,其任务是接受任何传入请求,并以空白 200 响应进行回复。我们的想法是尽量减少回复时间并确保我们不发送任何 40x 或 50x。
我尝试使用return 200;Nginx 中的所需位置,但我的监控系统 (Pingdom) 不喜欢响应,并认为服务器没有响应。
有没有更好的方法来做到这一点,当然,服务器上的开销最小?
我的任务是设置 300 台服务器的监控,做不同的事情。我一直在研究各种工具,例如 Nagios、Munin 和其他工具——所以我首先对如何实现监控有了一个很好的想法。
我想知道的是,如果我对服务器不太了解,通常将哪些指标作为良好的默认值进行监控?而且,就警报而言,什么是“合理的默认值”?
我的计划是首先部署一个具有合理默认值的监控方案,同时我会规划不同系统的角色——我预计这需要一些时间。
这个问题也可以用不同的方式问:
如果你正在设计一个监控设备——它的默认 Linux 监控模板应该包含什么?