sum*_*mek 9 monitoring munin nagios cacti ganglia
我有一个 nagios 服务器设置用于监控 ~ 30 个 Windows 服务器。我想添加一些趋势图表。我读到 nagios 图形插件很简单,很多人使用单独的、独立的图表/趋势工具。
nagios 绘图插件与 ganglia/munin/cacti 等独立产品相比有哪些限制?
我对独立软件包提供而 nagios 图形插件不提供的特定功能和优势感兴趣。
Mad*_*ter 13
我同意lynxman。NAGIOS 用于即时定性数据(X 是否正常?);munin 用于历史定量数据(X 现在有多满,今年有多满?)。我所有的 NAGIOS 安装,其中一些监控数百个服务,都链接到 munin 系统以进行定量监控。
另请注意,munin 具有用于将数据输入 NAGIOS 的特定钩子。它理解 WARNING 和 CRITICAL 阈值的概念,并且在需要通知(以及 NAGIOS“大板”上的视图)时,让单个 munin 变量通知单个 NAGIOS 服务的状态非常非常容易。
通常的工作流程是,在 NAGIOS 警告已违反阈值之前,没有人查看 munin 图表,但随后 munin 图表对于确定某事是否随着时间的推移缓慢上升,或者这是一个过时的情况变得非常宝贵-blue 增加,或者我们有一个每周的上下循环,幅度缓慢增加,或者什么。
正如 lynxman 所说,UNIX 方式是“一项任务,一种工具”。制作 munin 和 NAGIOS 的工具链对我来说非常有效,可以提供定量和定性监控以及通知。它也有保持清洁接口的独特的优势:当你看NAGIOS,你看怎么好东西都工作的一个简单的观点,现在,没有历史数据弄乱视图。当您查看 munin 时,您会看到与问题相关的历史信息可供您分析,而不会出现“主机已关闭”或“sshd 不会与我交谈”错误使视图混乱。
鉴于您已经安装了 nagios,请考虑使用 nagiosgraph 或 pnp4nagios。
nagiosgraph 和 pnp4nagios 在绘制 nagios 性能数据方面做得非常好。nagiosgraph 有一种基于参数的配置方法,pnp4nagios 有一种基于模板的方法。
对数据进行切片和切块非常重要,恕我直言。例如,您可以查看单个主机上的所有服务,或查看具有特定服务的所有主机,或查看任意主机和服务的任意图形集合。
安装并不简单,但并不困难。很大程度上取决于您想要自定义多少东西。例如,nagiosgraph 是“install.pl”或“rpm -i nagiosgraph.rpm”或“dpkg -i nagiosgraph.deb”。pnp4nagios 是 './configure; 制作; 进行安装'。
n2rrd 也可以做一些这样的事情,但它没有那么完善,需要更多的工作来配置。
rrdtool 有怪癖 wrt 数据存储,任何系统都会有采样问题。默认情况下,rrdtool 会进行一些数据平滑处理,但如有必要,除了平均值之外,您还可以捕获(并绘制)最大值和/或最小值。
由于每个 rrd 文件中的架构是静态的,并且大多数系统使用 rrd 文件名来标识数据,因此每个基于 rrdtool 的方法都会受到数据/图形陈旧的影响。当主机名或服务名称更改时,数据通常永远不会丢失;rrd 文件仍然存在于磁盘上。但是一些用户界面提供了查看“过时”rrd 文件的方法,其他用户界面需要通过命令行进行手动管理。在许多安装中,这只是最初配置系统时的一个问题,但在动态环境中(例如监控生命周期只有几个月的虚拟机),这可能会变得乏味。
最后一点。趋势分析实际上有两个部分:数据收集和数据展示。如果您使用独立的图形系统而不是扩展现有的 nagios 安装,那么您可能必须在 Windows 机器上安装其他组件才能收集数据。