相关疑难解决方法(0)

您使用什么工具来监控您的服务器？

如需更全面的监控工具及其功能列表，请查看此 Wikipedia 页面。

正如问题所述，用于此任务的最常用工具是什么，它们的优点和缺点是什么？

187
推荐指数

20
解决办法

24万
查看次数

CentOS 中的睡眠进程数量过多 - 如何诊断？

我有大量的休眠进程，大约600个，其中大部分是Apache进程。

我应该杀死所有这些睡眠进程，还是会让 Apache 完全失败？

为什么这些进程首先休眠？

服务器运行 CentOS 6 和 Apache 2.2。

centos centos6 apache-2.2

6
推荐指数

1
解决办法

2776
查看次数

最好/最差的监控系统是什么？

这是唯一正确答案是“视情况而定”的通用问题之一。标准是什么？

监控什么？
- 可达性、可用性？例如是一个链接上/下，主机是否响应 ICMP 等。
- 服务？例如是在正确的端口上侦听的东西，是正在运行的命名服务等。
- 资源？CPU使用率？例如，可能占总时间、累计时间、总时间或每个进程的百分比。磁盘使用情况？网络使用？例如移入或移出的字节或数据包。
- 服务？例如是在正确的端口上侦听的东西，是正在运行的命名服务等。
- 特定于服务或应用程序的指标？例如每秒的 DB 事务数、发送或接收的 SMTP 消息等。
如何发现/添加/设置/配置受监控元素？有自动发现吗？手动设置？
如何监控特定元素？
- 当地代理？例如做周期性的“df”或“ps”或“ping”
- 网管？
- JMX？
- Windows 性能计数器？
通知是怎么做的？例如控制台、电子邮件、寻呼机、SMS、IM 等。
如何对元素和通知进行分组和排序？
- 例如，链接失败是否会触发该链接后面所有服务或可达性元素的通知？还是只有一个？还是可以配置？
- 例如，主机故障是否会引发针对托管在那里的所有服务或应用程序以及缺乏资源监控数据的通知？
- 跟踪系统中是否有自动案例/票证/问题创建？
如何跟踪 SLA 指标？

4
推荐指数

2
解决办法

8629
查看次数

用于 ping HTTP 的命令行工具？

背景：这是一个常见问题，因为我们可以在谷歌搜索“ping 有效但 http 无效”

ping 不是网络连接的可靠测试。

ping 工作只是意味着有足够的 IP 堆栈可以处理 ICMP Echo 请求（与 SSH 和 Web 服务器所需的相比，这不是系统的很大一部分）。我们可能会遇到我所说的“部分恐慌”（内核崩溃，但 IP 代码继续运行）、内存不足，或者我们的 SSH/HTTPd 进程可能因不明原因而崩溃。

资源

我的问题：任何用于 ping HTTP 的命令行工具？

3
推荐指数

2
解决办法

2万
查看次数

自动修复软件

有谁知道“照顾服务器”的任何类型的应用程序或服务？（除了托管服务器）您的服务器或应用程序可以通过数百种方式停止正常工作。

小事情很容易错过，但通常很容易修复。日志过度生长、配置问题等。当然有最佳实践清单，但它不是检查配置最佳实践的人工任务。我确信它可以自动化：某种代理可以监控所有系统设置，说出对与错，并就如何使其正确提出建议。

我必须管理几台服务器，我需要某种总体情况的概述。作为一个工具，它会自动解决问题。

你能提出一些建议吗？

（我知道它有点不符合 SF 的规则，但我认为这个特定问题非常具体）拥有类似/sf/ask/101592361/ 之类的东西会很棒-engine-comparison 但用于自动化软件。

在否决之前

请理解我在问什么。它不是关于“寻找通用监控系统”，而是关于“寻找一个可以自行处理问题的系统”

-6
推荐指数

1
解决办法

83
查看次数

标签统计

http ×1

nmap ×1

ping ×1