一周前,我的 APC Smart-UPS 1000 出现以下错误,我将其静音。
Warning State:
Connect battery
Load: 55%
Batt: 100%
Run Code Online (Sandbox Code Playgroud)
今天,当我走进办公室时,我能闻到一种硫磺/硫磺/臭鸡蛋的气味,UPS 再次发出警报。没有燃烧的气味。
我已经对办公室和服务器机房进行了通风并关闭了 UPS。
有其他建议吗?
我最近经历了文件系统崩溃。我有一台服务器不间断地运行了大约 180 天,没有任何问题,但后来我注意到发生了奇怪的事情,显然 ext3 文件系统处于非常糟糕的状态。我测试了驱动器和内存,它们都很好。最终,我被迫对系统进行软管冲洗并完全重新安装。fsck.ext3只会让事情变得更糟。
现在,我不希望这种情况再次发生,所以这次我改用了 XFS,我觉得它比 ext3 更成熟,但我不知道如何监控文件系统的健康状况。xfs_check根本不会让我在安装时扫描设备。
那么,您如何在系统在线时监控 XFS 文件系统的健康状况?
大家好!我正在寻找一些软件来监控我们服务器的健康状态。我们的环境是运行 Microsoft Server 和 VMware vSphere 的 HP/Dell 的典型组合。我们目前正在使用 WhatsUPGold,并希望从中迁移。我一直在检查戴尔管理控制台和 IT Assistant,但我认为用它来监控我们所有的产品似乎很麻烦。
还有其他适用于中等规模环境的建议吗?
编辑:我还应该注意,我想要一些相当容易推出的东西,不需要很多规则/自定义规则创建/编辑。
互联网上到处都是“锡纸帽子”之类的人,他们不敢使用无线设置,但是随着无线网络数量的增长,我对良好而客观的案例研究以及对该主题的总体态度感兴趣。
贵公司是否考虑了可能的健康风险,或者通常根本没有被视为威胁?
如果您有关于此问题的优秀案例研究或资源的链接,请将它们包含在您的答案中或将它们添加到下面的汇总列表中。
资源和相关阅读:
我想查询大量 HP 服务器以确定它们的整体健康状况。我不想使用任何软件包,甚至 SNMP - 我想从 WMI 查询服务器健康状况并了解一个框是否是绿色/琥珀色/红色 - 就像 HP 管理主页一样。
这一定是可能的 - 但我找不到任何文件......
哦,是的,服务器运行的是 Windows Server 2003/8。
帮助!!
麦克风
我正在运行多个在 CentOS 上运行的 Web 代理服务器,我正在寻找一种简单的方法来持续监控服务器的健康状况(它们响应 Web 请求的速度、网页加载的速度等)
我正在考虑使用 Web 界面(也许是 PHP 脚本?),或者可能使用 bash 提示中的工具。有什么简单的方法可以做到这一点?谢谢!
我想要一个简单的 Debian 定时任务,它可以检查磁盘已满或高负载等基本内容。
我相信已经有了解决方案,这样我就可以节省时间而不必编写自己的脚本。
欢迎任何建议。
UPD:我会坚持使用 monit,因为它更容易设置,但如果我需要更复杂的东西,我会使用 Nagios 插件。
谢谢大家!