标签: monitoring

Nagios 主机关闭但服务正常

我有几台服务器 (ftp),其中主机阻止了 ICMP,因此其显示为已关闭,但服务(如 ftp)已启动。

为了停止服务抱怨主机宕机,我已经承认了这个问题。我遇到的问题是有一天晚上 FTP 服务死掉了,但我们没有收到有关它的通知。

我怎样才能仍然收到有关 Nagios 认为已关闭的主机上的服务状态的通知,如果我禁用主动检查,这会解决问题吗?

干杯卢克

monitoring nagios

4
推荐指数
1
解决办法
8650
查看次数

服务关键时的不同通知间隔

我在 Nagios 中有一项服务可以检查服务器上使用了多少磁盘空间。

当使用率超过80%时,服务就处于状态warning。当超过97%时才考虑critical

当服务启动时,warning我想每天发送一次警报 ( notification_interval 1440)。当服务很关键时,我想每两小时发送一次警报 ( notification interval 120)。

我该如何设置?

是否可以在一项服务中进行设置,或者我是否需要定义两项服务,一项为 发送警报,warning另一项为 发送警报critical

谢谢。

monitoring nagios alerts

4
推荐指数
1
解决办法
3461
查看次数

UPS 断电时的带外通知?

我们目前正在考虑升级我们的 UPS,并可能在现场安装一个小型汽油发电机,以防 UPS 电池使用时间足够长以完全耗尽它。

实际上,我们只能买得起 UPS 可以给我们大约 45 分钟的时间。我们的大楼停电 4-6 小时并非闻所未闻。不过,这是非常罕见的。

有哪些产品可以在 UPS 切换到电池供电时发送通知(短信、自动呼叫等)?我们看过的一些 UPS 具有串行连接。你如何处理这种事情?

计划是当停电时,电池接管并提醒团队。我们中的一个人(随叫随到)驾驶建筑物并启动发电机。当然,除非通知通过电源重新打开。

我们目前确实使用 Pingdom 来监控我们服务的正常运行时间。这只是一个 ping 测试,所以我们不能依赖丢失的主机来解释它丢失的原因。例如; 如果网络连接中断,备份链接也中断,我们会收到通知。这并不一定意味着需要启动生成器。

disaster-recovery monitoring ups infrastructure

4
推荐指数
1
解决办法
1948
查看次数

如何使用 sonicwall tz205 监控用户活动?

如何使用Sonicwall tz205,在windows网络上运行,集中监控用户的浏览习惯?

我正在寻找一份报告,该报告将显示 LAN 用户的 IP 地址和他们访问/使用的网站/服务。

monitoring firewall sonicwall

4
推荐指数
1
解决办法
2万
查看次数

如何监控运行嵌入式 Linux 和 BusyBox 的设备上的 CPU 使用情况?

我最近开始使用使用嵌入式 Linux 和 BusyBox 的设备。它非常精简,没有iostatsar。它也没有用于包管理的dpkgapt 。该系统是一个保密协议下的开发黑盒,操作系统版本信息是:

Linux localhost 2.6.34 #1 SMP Fri Sep 14 10:12:23 EDT 2012 armv7l GNU/Linux
Run Code Online (Sandbox Code Playgroud)

我想监视系统资源,特别是 CPU 和内存使用情况,并且想知道如何执行此操作。看来 BusyBox 唯一可用的命令是top,我想要其他替代方法。

我想我可以在我的 Windows 开发系统上交叉编译sar并以某种方式将其复制过来,但我从未这样做过......但是,如果这是我的最佳选择,我愿意尝试一下,所以该领域的提示将受到赞赏。

编辑:在阅读了SAR 的 Linux 实现之后,看来我不会简单地交叉编译sar,而是包含sar和其他相关命令的sysstat实用程序套件。

monitoring busybox cpu-usage

4
推荐指数
1
解决办法
1万
查看次数

确认主机/服务时的 check_mk 粘性评论是什么?

我想在 Nagios 监控的系统上附加一条评论。我更喜欢使用 check_mk 作为 GUI。现在我偶然发现了这一点:我可以将评论设置为粘性和/或持久性。

所以我问我们的 Nagios 管理员粘性和持久性之间的区别是什么。

事实证明,他不知道“粘性” - 这必须是特定于 check_mk 的东西。

在谷歌和检查 check_mk 文档之后,我找不到关于该主题的任何信息。

那么:Nagios-service-comments 的粘性和持久性之间有什么区别?

更新:这是一个屏幕截图 - check_mk 快速搜索特定服务器,然后选择hamer-symbol。然后会出现这个:

截屏

问题是关于确认框:粘性与持久性

monitoring nagios graphical-user-interface check-mk

4
推荐指数
1
解决办法
1万
查看次数

当内存严重不足时自动终止/重新启动进程

我有一个 Debian Wheezy VPS 盒子,在生产环境中运行几个 Django 应用程序。理想情况下,我会尝试通过优化应用程序、添加更多 RAM 或使用交换来增强内存占用问题。但问题是,我怀疑我会从优化 Django 应用程序中获得很多内存优化(堆栈是开源且强大的),并且添加 RAM 对我来说是一个成本限制(这是一个远程 VPS),而且,主机不提供使用交换的选项!

因此,与此同时(当我等待获得更多资源以提供更多 RAM 时),我希望减轻服务器耗尽内存的情况,这样我只需请求重新启动 VPS(此时,我甚至无法通过 SSH 进入盒子!)。

因此,我希望解决方案能够检测进程(或者一般来说,系统总内存使用量)何时超过某个临界量(目前,例如免费 RAM 下降到 10%)——我已经值得注意的是,VPS 运行很长时间后,某些大型应用程序的流量突然变得很大(无论如何,大多数只是临时应用程序)。

因此,我希望能够终止/重新启动有问题的进程 - 最有可能是 Apache。在这些情况下手动完成的哪种解决方案可以恢复正常的内存使用水平 - 暗示可能一个或多个 Django 应用程序存在内存泄漏?


简单来说:

  1. 监控整体系统 RAM 使用情况
  2. 当空闲 RAM 低于给定的临界阈值(比如低于 10%)时,终止/重新启动有问题的进程 - 或者更简单,如果我们从我当前的日志分析(使用 linux-dash)假设 Apache 通常是违规者,然后杀死/重新启动它。
  3. 冲洗并重复...

linux monitoring memory process memory-leak

4
推荐指数
1
解决办法
1万
查看次数

Cacti 如何使用脚本收集数据?

我们知道Cacti使用SNMP来查询和收集数据。据我所知,SNMP 管理器使用对象 ID (OID) 来查询某个对象,并从 SNMP 代理获取有关该 OID 的响应。

让我困惑的是Cacti如何使用egperlpython脚本来收集数据?那么它使用SNMP吗?如果是的话,协议如何运作?

linux monitoring snmp cacti

4
推荐指数
1
解决办法
7699
查看次数

人像模式宽屏液晶显示器推荐

在我的办公室,我们计划以纵向模式部署宽屏 LCD 显示器。我们买了一个用于测试(三星 T220 不可旋转,所以我们为它调整了一个可旋转的支架),尽管有规格 (170/160),但在这种模式下它没有很好的可视角度。在纵向模式下,视角并不像在横向模式下那样好,即使您以 90 度角注视它,屏幕的一侧也比另一侧更亮/更暗。有人知道适合这种模式的液晶宽屏显示器(最好是 22 英寸 1680x1050)吗?

monitoring

3
推荐指数
1
解决办法
2712
查看次数

SQL Server 的“顶级”样式活动监视器?

我对 SQL Server 2005 附带的 Activity Monitor 并不感到兴奋,尽管我认为它正在尝试做同样的事情。

查询片段、用户名、数据库名称、来自表名、CPU 时间、IO 时间、分配的内存、可能获得的锁...

将刷新速度设置为 2-3 秒,让它运行?

我喜欢分析器——对性能调优非常有用;但有时像 top 这样工作的东西对于故障排除来说会很棒。

编辑:不需要 sql studio 的命令行工具可能不错。

monitoring sql-server sql-server-2005

3
推荐指数
1
解决办法
1793
查看次数