Green-IT:您如何处理系统监控中的断电系统?

knw*_*iss 7 electrical-power nagios system-monitoring

你们中的许多人可能已经完成或正在考虑绿色 IT项目,其目标是在对计算机资源的需求较低时关闭空闲或不需要的系统:

您是如何在系统监控中处理这种情况的?我对Nagios 的解决方案特别感兴趣。

一种想法是在Nagios 中为断电的主机安排停机时间。但是,此解决方案的缺点是主机仍会列在Nagios Web 界面的“问题”视图中。有没有没有这种“污染”的更好的解决方案(即“问题”视图是否仅显示需要系统管理员维护的实际问题)。

一个干净的解决方案将是一个新的“绿色 IT 电源关闭”主机状态。但是AFAIK这不存在,是吗?您有其他建议或解决方案吗?监控动态 IT 环境的最佳方式是什么?

Kei*_*ith 2

最简单的方法:

页面顶部有状态视图的内置过滤器。您可以让管理员监视“未确认”的问题,或者不在计划停机时间内的主机上的问题。或任何其他数量的组合。

如果您确实想对 CGI 视图进行过滤,请参阅源代码中 cgiutils.h 的“主机和服务过滤器属性”部分,以获取可用过滤器的完整列表。

困难的方法:

请参阅有关自适应监控的文档。这样,您就可以在系统自动关闭/打开时动态更改 nagios conf。例如,您可以调整检查周期、将检查命令更改为 check_dummy 变体、启用/禁用事件处理程序等。