我的数据库服务器(一个 CPU 虚拟机)由 Nagios 监控。
我没有使用 Nagios 的经验,也无法理解此图:
我得到了 nagios 监控,它正在特定服务器上获取高交换使用率。用户正在使用一些触发高交换的应用程序。即使在他们退出应用程序后,top仍然显示使用了高交换。
我试过使用swapoff -a和swapon -a。它不会重置top内的计数器。
似乎重置计数器的唯一方法是重新启动服务器。这是一种痛苦。
我写了一个 Nagios 检查,它计算有多少 pgpool 进程正在运行以及每个进程运行了多长时间。我在 Linux CentOS 6.4 上运行
为了获得进程运行的时间,我使用了下一个命令:
ps -p PID -o etime=
Run Code Online (Sandbox Code Playgroud)
例子:
[root@pgpool ~]# ps -p 28737 -o etime=
08:35:48
[root@pgpool ~]#
Run Code Online (Sandbox Code Playgroud)
这是正常输出,但有时我会得到以下输出并破坏脚本:
7-17:15:52
示例:
[root@pgpool ~]# for prc in $(ps -ef | grep pgpool | grep -v wait | grep -v PCP | awk '{print $2}'); do ps -p $prc -o etime= ; done
40:55
22:08:43
23:55
15:12:36
20:35
7-17:15:52
09:34:35
29-00:56:18
[root@pgpool ~]#
Run Code Online (Sandbox Code Playgroud)
所以我的问题是:
我有一个主机服务器,它有自己的 MIB 文件,但我需要能够在 Nagios 4.1 核心上捕获 MIB 陷阱。我正在使用安装在 RedHat 6.5 上的 SNMPTT 插件,但我无法在 SNMPTT 中获取陷阱。
我生成 snmp 事件./simulate_events_tf.sh
(在我监控的主机上)
内容 tail /var/log/messages
9 月 18 日 12:33:02 gdl-storage snmptrapd[32621]:无访问配置 - 丢弃陷阱。
9 月 18 日 12:33:02 gdl-storage snmptrapd[32621]:无访问配置 - 丢弃陷阱。
9 月 18 日 12:33:02 gdl-storage snmptrapd[32621]:无访问配置 - 丢弃陷阱。
9 月 18 日 12:33:02 gdl-storage snmptrapd[32621]:无访问配置 - 丢弃陷阱。
9 月 18 日 12:33:02 gdl-storage snmptrapd[32621]:无访问配置 - 丢弃陷阱。
9 月 18 日 12:33:02 gdl-storage snmptrapd[32621]:无访问配置 - 丢弃陷阱。
9 月 18 …