如需更全面的监控工具及其功能列表,请查看此 Wikipedia 页面。
正如问题所述,用于此任务的最常用工具是什么,它们的优点和缺点是什么?
我有大量的休眠进程,大约600个,其中大部分是Apache进程。
我应该杀死所有这些睡眠进程,还是会让 Apache 完全失败?
为什么这些进程首先休眠?
服务器运行 CentOS 6 和 Apache 2.2。
这是唯一正确答案是“视情况而定”的通用问题之一。标准是什么?
背景:这是一个常见问题,因为我们可以在谷歌搜索“ping 有效但 http 无效”
ping 不是网络连接的可靠测试。
ping 工作只是意味着有足够的 IP 堆栈可以处理 ICMP Echo 请求(与 SSH 和 Web 服务器所需的相比,这不是系统的很大一部分)。我们可能会遇到我所说的“部分恐慌”(内核崩溃,但 IP 代码继续运行)、内存不足,或者我们的 SSH/HTTPd 进程可能因不明原因而崩溃。
资源
我的问题:任何用于 ping HTTP 的命令行工具?
有谁知道“照顾服务器”的任何类型的应用程序或服务?(除了托管服务器)您的服务器或应用程序可以通过数百种方式停止正常工作。
小事情很容易错过,但通常很容易修复。日志过度生长、配置问题等。当然有最佳实践清单,但它不是检查配置最佳实践的人工任务。我确信它可以自动化:某种代理可以监控所有系统设置,说出对与错,并就如何使其正确提出建议。
我必须管理几台服务器,我需要某种总体情况的概述。作为一个工具,它会自动解决问题。
你能提出一些建议吗?
(我知道它有点不符合 SF 的规则,但我认为这个特定问题非常具体)拥有类似/sf/ask/101592361/ 之类的东西会很棒-engine-comparison 但用于自动化软件。
在否决之前
请理解我在问什么。它不是关于“寻找通用监控系统”,而是关于“寻找一个可以自行处理问题的系统”