wic*_*ett 5 cloud cloud-computing monitoring nagios zabbix
在云中运行并自动扩展盒子时,会遇到某些监控问题。有时我们可能会监控 10 个盒子,有时会监控 100 个。这些机器会根据需求扩大和缩小。
现在,我认为最好的解决方案是选择一个监控解决方案,通过调用 API 来实例化目标。但是,这真的是最好的吗?我喜欢动态发现的想法,但这也是云中的一个问题,因为目标并不都在同一个子网中。
什么样的监控解决方案允许这样的扩展环境?Zabbix 目前有一个API 草案,但我一直无法为 Nagios 提供类似的 API。Nagios 有类似的 API 吗?
除了 Nagios 和 Zabbix 之外,还有人有其他建议吗?
Farmville声称每周添加数百台服务器,使用Puppet、Nagios和Munin来处理其可扩展的监控系统。他们可能使用 Puppet 事实来填充 Nagios 配置文件或设置NRPE。对于如此多的服务器,像 Puppet 这样的配置管理工具实际上是必需的。
通过搜索“puppet nagios”找到的几个示例:
http://blog.gurski.org/index.php/2010/01/28/automatic-monitoring-with-puppet-and-nagios/
http://projects.puppetlabs.com/projects/puppet/wiki/Nagios_Patterns
https://github.com/DavidS/puppet-nagios