为动态扩展环境选择监控系统:Nagios 诉 Zabbix

wic*_*ett 5 cloud cloud-computing monitoring nagios zabbix

在云中运行并自动扩展盒子时,会遇到某些监控问题。有时我们可能会监控 10 个盒子,有时会监控 100 个。这些机器会根据需求扩大和缩小。

现在,我认为最好的解决方案是选择一个监控解决方案,通过调用 API 来实例化目标。但是,这真的是最好的吗?我喜欢动态发现的想法,但这也是云中的一个问题,因为目标并不都在同一个子网中。

什么样的监控解决方案允许这样的扩展环境?Zabbix 目前有一个API 草案,但我一直无法为 Nagios 提供类似的 API。Nagios 有类似的 API 吗?

除了 Nagios 和 Zabbix 之外,还有人有其他建议吗?

Rob*_*mos 3

Farmville声称每周添加数百台服务器,使用PuppetNagiosMunin来处理其可扩展的监控系统。他们可能使用 Puppet 事实来填充 Nagios 配置文件或设置NRPE。对于如此多的服务器,像 Puppet 这样的配置管理工具实际上是必需的。

通过搜索“puppet nagios”找到的几个示例:

http://blog.gurski.org/index.php/2010/01/28/automatic-monitoring-with-puppet-and-nagios/

http://projects.puppetlabs.com/projects/puppet/wiki/Nagios_Patterns

https://github.com/DavidS/puppet-nagios