我最近作为唯一的 IT 人员加入了一家公司,我正在努力了解我们拥有哪些软件和硬件以及如何部署它们。考虑到我有限的时间和预算,哪些工具或流程可以有效地发现和管理这些信息?我正在照顾的事情包括:
我的目标是:
我们在我们的网络中安装了 IPCop 防火墙/代理,虽然我可以使用 iftop 来查看客户端如何使用 Internet,但是否可以使用诸如 ntop 之类的东西从代理外部对其进行监视?
请注意,我对 LAN 流量不感兴趣,只对进出 Internet 的流量感兴趣。
我刚刚在 Gentoo 服务器上部署了 Nagios,除了 ssh 之外,一切都很好,它标记为“CRITICAL”,因为它拒绝连接。但那是因为它在不同于默认 22 的端口上运行。如何更改它以便它监视正确的端口?
我在三个不相交的网络上设置了 Nagios,这些网络都在防火墙后面。监控工作得很好,我正在掌握一些复杂的配置。我有一台位于这些网络之外的服务器,可供他们使用。理想情况下,我想做的是让防火墙内的这些 Nagios 服务器继续进行正常监控并像以前一样发送通知,但我希望它们都将数据发送到我拥有的服务器在防火墙之外。
从本质上讲,这个服务器将是一个我可以同时看到每个不相交网络内部发生的所有事情的地方,唯一与它联系的是其他其他 Nagios 服务器。防火墙配置不是问题,我只是不知道如何在 Nagios 中配置它。
我在所有监控服务器上运行 Nagios 3.2.1,从 CentOS 5.5 上的源代码编译,使用 NSClient++ 监控 Windows 服务器
你们都在做什么来监控运行免费版的 ESXi 服务器?由于缺乏 SNMP 支持,这对我来说似乎相当有限。我希望能够在驱动器或其他硬件出现故障时获得某种类型的警报。我看过一些关于在 ESXi 机器上安装 OpenManage(重建阵列)的文章,但这似乎也很痛苦。即使我让 OpenManage 正常工作,如果没有 SNMP,我也不会收到警报。
任何评论、意见或指导将不胜感激。
monitoring hp-proliant vmware-esxi dell-poweredge system-monitoring
如何使用 Ubuntu 12.04 监控 HP Proliant 服务器的硬盘和 RAID 状态。在 Ubuntu 10.04 中,我可以使用 cciss-vol-status 定期查询 RAID 状态,但 cciss-vol0-status 不再适用于 12.04。在 12.04 中没有 /proc/driver/cciss 或 /dev/cciss 目录。
任何人都知道是否可以在 munin 图中用红色垂直线标记每个部署?调试代码中可能存在的性能漏洞会很棒。
提前致谢!
我们使用石墨来跟踪磁盘使用历史。当可用空间低于一定数量的块时,我们的警报系统会查看来自石墨的数据以提醒我们。
我想获得更智能的警报 - 我真正想要的是关心的是“在我必须对可用空间做一些事情之前我还有多长时间?”,例如,如果趋势表明在 7 天内我将用完磁盘空间然后引发警告,如果不到 2 天,则引发错误。
Graphite 的标准仪表板界面对于衍生品和 Holt Winters 置信度带非常智能,但到目前为止我还没有找到将其转换为可操作指标的方法。我也可以用其他方式处理数字(只需从石墨中提取原始数字并运行脚本来执行此操作)。
一个复杂的问题是图形不平滑 - 文件被添加和删除,但随着时间的推移,总体趋势是磁盘空间使用量增加,因此可能需要查看局部最小值(如果查看“磁盘空闲”指标) ) 并在低谷之间绘制趋势。
有没有人做过这个?
Linux 服务器上的应用程序正在使用几个 10-20 GB 的大文件。它不断地写入和读取所有这些,我想查看使用详细信息:哪个文件正在大量使用,查看带宽,操作计数等。有没有办法做到这一点?
monitoring ×10
hp-proliant ×2
linux ×2
nagios ×2
bandwidth ×1
deployment ×1
graphite ×1
hp ×1
keyboard ×1
laptop ×1
munin ×1
port ×1
raid ×1
resources ×1
ssh ×1
ubuntu ×1
vmware-esxi ×1