Nagios 绘图解决方案 vs Munin/Cacti/Ganglia

Question

Nagios 绘图解决方案 vs Munin/Cacti/Ganglia

sum*_*mek 9 monitoring munin nagios cacti ganglia

我有一个 nagios 服务器设置用于监控 ~ 30 个 Windows 服务器。我想添加一些趋势图表。我读到 nagios 图形插件很简单，很多人使用单独的、独立的图表/趋势工具。

nagios 绘图插件与 ganglia/munin/cacti 等独立产品相比有哪些限制？

我对独立软件包提供而 nagios 图形插件不提供的特定功能和优势感兴趣。

Answer 1

Mad*_*ter 13

我同意lynxman。NAGIOS 用于即时定性数据（X 是否正常？）；munin 用于历史定量数据（X 现在有多满，今年有多满？）。我所有的 NAGIOS 安装，其中一些监控数百个服务，都链接到 munin 系统以进行定量监控。

另请注意，munin 具有用于将数据输入 NAGIOS 的特定钩子。它理解 WARNING 和 CRITICAL 阈值的概念，并且在需要通知（以及 NAGIOS“大板”上的视图）时，让单个 munin 变量通知单个 NAGIOS 服务的状态非常非常容易。

通常的工作流程是，在 NAGIOS 警告已违反阈值之前，没有人查看 munin 图表，但随后 munin 图表对于确定某事是否随着时间的推移缓慢上升，或者这是一个过时的情况变得非常宝贵-blue 增加，或者我们有一个每周的上下循环，幅度缓慢增加，或者什么。

正如 lynxman 所说，UNIX 方式是“一项任务，一种工具”。制作 munin 和 NAGIOS 的工具链对我来说非常有效，可以提供定量和定性监控以及通知。它也有保持清洁接口的独特的优势：当你看NAGIOS，你看怎么好东西都工作的一个简单的观点，现在，没有历史数据弄乱视图。当您查看 munin 时，您会看到与问题相关的历史信息可供您分析，而不会出现“主机已关闭”或“sshd 不会与我交谈”错误使视图混乱。

Answer 2

Mat*_*all 7

鉴于您已经安装了 nagios，请考虑使用 nagiosgraph 或 pnp4nagios。

nagiosgraph 和 pnp4nagios 在绘制 nagios 性能数据方面做得非常好。nagiosgraph 有一种基于参数的配置方法，pnp4nagios 有一种基于模板的方法。

每当 nagios 配置更改时，它们都会自动检测新的主机/服务
两者都做图形缩放
当您将鼠标悬停在特定主机/服务上时，两者都提供图表
两者都提供了许多切片和切块数据的方法
检测和绘制您已经在 nagios 中定义的严重和警告级别
两者都可以直接嵌入到 nagios 框架中，以实现从当前状态到历史和返回的无缝、整洁的导航

对数据进行切片和切块非常重要，恕我直言。例如，您可以查看单个主机上的所有服务，或查看具有特定服务的所有主机，或查看任意主机和服务的任意图形集合。

安装并不简单，但并不困难。很大程度上取决于您想要自定义多少东西。例如，nagiosgraph 是“install.pl”或“rpm -i nagiosgraph.rpm”或“dpkg -i nagiosgraph.deb”。pnp4nagios 是 './configure; 制作; 进行安装'。

n2rrd 也可以做一些这样的事情，但它没有那么完善，需要更多的工作来配置。

rrdtool 有怪癖 wrt 数据存储，任何系统都会有采样问题。默认情况下，rrdtool 会进行一些数据平滑处理，但如有必要，除了平均值之外，您还可以捕获（并绘制）最大值和/或最小值。

由于每个 rrd 文件中的架构是静态的，并且大多数系统使用 rrd 文件名来标识数据，因此每个基于 rrdtool 的方法都会受到数据/图形陈旧的影响。当主机名或服务名称更改时，数据通常永远不会丢失；rrd 文件仍然存在于磁盘上。但是一些用户界面提供了查看“过时”rrd 文件的方法，其他用户界面需要通过命令行进行手动管理。在许多安装中，这只是最初配置系统时的一个问题，但在动态环境中（例如监控生命周期只有几个月的虚拟机），这可能会变得乏味。

最后一点。趋势分析实际上有两个部分：数据收集和数据展示。如果您使用独立的图形系统而不是扩展现有的 nagios 安装，那么您可能必须在 Windows 机器上安装其他组件才能收集数据。

归档时间：	15 年前
查看次数：	16533 次
最近记录：	12 年，1 月前