您使用什么工具来监控您的服务器?

Aro*_*eel 187 monitoring

如需更全面的监控工具及其功能列表,请查看此 Wikipedia 页面

正如问题所述,用于此任务的最常用工具是什么,它们的优点和缺点是什么?

jdi*_*iaz 136

我过去曾成功地使用过Nagios。它具有很强的可扩展性(超过 200 个附加组件)、相对易于使用和大量报告。负值将是初始设置。

  • 有一个新的 nagios 分支叫做 icinga。目前还没有,但他们的目标看起来很有希望。http://www.icinga.org/ (12认同)
  • Nagios 可以很好地监控所有类型的主机(Windows、Linux、路由器、交换机等)。我建议使用诸如 Fruity 或 Lilacto 之类的配置工具来减轻配置的痛苦。Windows 上的 NSClient++ 和 linux 上的 nagios-statd 来监控正在运行的进程、磁盘使用情况等。 (10认同)

pau*_*reg 70

CactiRRDTool 的一个非常好的基于 Web 的前端,提供非常方便的图表和统计信息。 RRDTool是从多个系统收集数据并监控范围广泛的技术数据的部分。

我们正在使用 cacti/RRDTool 解决方案来监控 Unix 和 Windows 系统。我们得到了很多有用的指标,包括负载、CPU/RAM 使用率、硬盘空间、登录用户、网络流量、正在运行的进程等。

您可以在什么是仙人掌?页。


pil*_*lif 57

就我个人而言,我喜欢Munin,它非常易于安装和编写插件,因为它具有非常简单的架构。已经有很多插件可以用于您可以想象的所有目的,因此您可能甚至不必首先编写插件。

它还提供漂亮的图形和配置(非常基本的)警报的选项。

  • 我也是穆宁的忠实粉丝。它支持与 Nagios 集成(因此您可以同时运行两者),并支持所有常见的 Unix 版本。我不认为有任何支持监视 Windows 节点 - 但是它是用 Perl 编写的,所以虽然它可能很重要,但它肯定是*可能的*。 (2认同)
  • @约翰。Windows 节点通过作为本机 munin 节点的 munin-node-win32 或像任何主机一样通过 SNMP 获得支持。 (2认同)

Ton*_*yer 34

扎比克斯。它是开源的,设置和定制相当简单。我们有很多自定义监控脚本输入 zabbix 服务器,但它负责集中这些数据,适当地显示它,通知(电子邮件、IM、SMS、Twitter 等)等等。

  • 我更喜欢 Zabbix,因为它在绘制和映射基础设施(在可用性方面)以及灵活的监控方式方面具有灵活性。 (3认同)
  • 我们也在使用 Zabbix,发现它非常强大且可配置。我们测试了 Zabbix 和 Nagios 并最终选择了 Zabbix,因为虽然 Nagios 似乎享有良好的声誉,但安装起来有点麻烦,而且很多功能来自插件而不是核心应用程序中的功能(图形是一个一个很好的例子,你可以通过 Zabbix 免费获得)。 (2认同)

Sha*_*ard 29

我一直在我们公司推出Spiceworks,我们发现它是一个很好的工具,不仅可以监控服务器,还可以监控网络上的其他一切。

它会执行诸如自动库存和自定义监控之类的操作,以便在出现问题时向您发送电子邮件(例如:打印机的墨水量下降到 10% 或此服务器的硬盘驱动器有 20%)。

它的缺点可能是每台计算机的信息密度,不要误会它每台机器有很多数据,但是对于诸如服务器之类的东西,您可能需要大量统计信息,您可能需要使用其他工具。

编辑:哦,我有没有提到它的商业模式是基于永远免费的。

  • SpiceWorks 有一个非常大的社区,与 ServerFault 也有很多重叠。看到社区之间的相互作用会很有趣。我也使用 SpiceWorks。很棒的工具。 (3认同)

小智 18

Smokeping不仅检查各种服务器和服务的可用性,还跟踪它们的延迟,同时提供易于使用、美观和快速显示的图形。

开箱即用的各种延迟测量插件。如果您了解一些 Perl,就很容易为任何异国情调的需要创建自己的 Perl。

大型装置将受益于分布式测量的主/从系统。

高度可配置的警报系统将帮助您在问题开始影响用户或演变为重大中断之前发现问题。

Smokeping 是由 MRTG 和 RRDtool 的创建者 Tobi Oetiker 用 Perl 编写的免费开源软件


jas*_*cao 15

我工作的地方使用OpenNMS来监控一千多台 Linux 机器。我们监控每台机器的硬件以及在它们上面运行的应用程序。


gim*_*mel 15

Zenoss Core有一些用处,我们将它(大约一年)用于服务器、网络交换机和 UPS 的轻量级监控。

Zenoss Core 是一款屡获殊荣的开源 IT 监控产品,可通过单个集成软件包有效管理网络、服务器和应用程序的配置、运行状况和性能。


Rob*_*ean 12

Nagios 很棒,因为它是免费的,而且有很多插件。然而,UI 和配置是非常困难的。

与专业版/专业版完全相反,微软系统中心运营管理器 (SCOM) 也很棒,它不是免费的,插件较少,但设置和配置非常出色且简单。

我必须承认,如果我在一家主要是 Microsoft 的公司工作,有非常高的依赖要求(即无法承受监控中断)或不得不考虑让开发人员使用它,那么 SCOM 将是我的推荐而不是 Nagios。


Ave*_*yne 12

我用过:

  • Nagios - 需要一些老式的命令行设置,不漂亮,但坚固且实用。它已被取代:
  • Zenoss - 设置所需的步法要少得多,具有商业变体。运行后,其余部分通过浏览器进行控制。非常强大,但如果您使用免费版本,则需要一些 MIB 工作。
  • Intermapper - 商业程序,如果你有很多节点需要监控,那就太浪费了。似乎是用 Java 编写的(无论好坏)。
  • Spiceworks - 还没有尝试过最新版本。旧版本需要在引擎盖下更多一点才能让它做出响应,但除此之外,它运行良好。免费版带有唠叨广告。


小智 11

我们使用AlertFox几个星期以来,很高兴。它不仅检查我们的正常运行时间和性能,还通过交易脚本(基于 iMacros)监控购物车、用户登录和网站的其他关键部分。

对于我们的内部监控(磁盘空间等),我们使用Nagios


Bra*_*don 10

PRTG 网络监视器 - 不能说太多关于它的好东西。很棒的 Web 前端,特别适合通过 SNMP 监控路由器(带宽等)和其他设备并测量 SLA 的正常运行时间等。

www.paessler.com


Ric*_*den 9

作为 Windows 人,妈妈。我们希望升级到 Systems Center Operations Manager (SCOM),但在我们开始部署 Windows 2008 之前不需要升级。


spo*_*son 8

我是运营监控升级项目的一部分。我们已经让不同的供应商到现场展示了一些大美元的系统,并混合了一些更便宜的替代品进行比较。

其中之一是Hyperic,它也可作为免费的开源解决方案提供。它为自定义代理提供的功能和可扩展性给我留下了深刻的印象。


Wes*_*ing 8

为了监控统计信息(内存使用、负载、mysql 活动、apache 活动等),我使用Munin。开箱即用,它已经跟踪了很多事情并绘制了不同时间间隔(过去 24 小时、过去 7 天、上个月、去年)的图表。通过插件可以监控更多的事情。它的输出是带有漂亮图形的 HTML 页面。

Munin 具有主/节点架构:节点在服务器上收集统计信息,主存储数据并生成 HTML 和图形。

我使用Monit来跟踪正在运行的进程,并在出现某些可配置的情况(高 CPU 负载、高内存使用率、无 HTTP 响应等)时重新启动或提醒我。 Monit 还可以监视有关服务器的更一般的事情,例如 CPU负载、内存使用情况、硬盘状态或磁盘使用情况。

Monit 需要针对您想要监控的每个服务或硬件以及在出现问题时如何响应进行配置。最常用的选项是什么都不做,发送警报电子邮件或重新启动服务。

Monit 在工作时很棒,但有时它无法启动、停止或重新启动服务,并且没有很多可用的诊断信息来告诉您出了什么问题。这意味着您不知道问题是出在您的服务上还是出在 Monit 配置上,后者在类似 cron 的最小环境中运行。

默认情况下,这两种工具在大多数 Linux 发行版上都可用。


Bre*_*nt 8

我很惊讶没有人提到Linux 服务器的logwatchlogcheck - 节省了大量时间阅读日志!!


Jon*_*ury 7

我使用Pingdom来监控我的服务器。当服务器无法访问时,它会向我发送一条 SMS 消息。


Jon*_*son 7

我们的项目将Ganglia用于我们的 100 多个节点集群。我们使用它的一个原因是因为它是Rocks附带的监控工具。

对我们来说,每个节点上的开销都非常低,以便尽可能多的资源可用于计算,这一点很重要。Ganglia 为我们提供了集群的良好概览,并允许我们在需要时深入查看单个节点。除了知道现在发生了什么之外,我们还可以很好地了解过去一小时、一天、一周、一个月和一年中发生的事情。各种统计图表是基本的和功能性的。


Dav*_*osh 6

这完全取决于您所说的“监视器”是什么意思!

  • 它(系统或服务)是否可用?我们使用nagios
  • 它在做什么?我们将munin用于 linux 服务器,而cacti用于其他几乎所有东西,尽管有时配置起来很痛苦......
  • 它做了什么?我们使用 syslog-ng 将 syslog 集中在一个地方,然后每天运行自定义的日志检查脚本以通过电子邮件发送报告。我们正在为 Windows 服务器寻找类似的东西。


ccl*_*ark 5

Graphite ( http://graphite.wikidot.com/ )

RRDTool 被一个名为 Whisper 的后备存储所取代。文档很好地概述了为什么它不同,我真的很喜欢 CLI 在调查某些事情时进行临时绘图。