Munin:一切正常时通知

Céd*_*ard 4 munin

我用一个 Munin-Master 监控 20 多台服务器,除了一台服务器外,都运行良好。最后三封穆宁邮件收到:

05h25

infra :: backup2.infra :: 磁盘使用百分比 OKs:/var 为 22.55,/run/user/1001 为 0.00,/home 为 8.87,/mnt/usb1 为 30.55,/export/oxa 为 51.58,/tmp 为0.60,/dev/shm为0.00,/space2为40.39,/run为8.77,/run/lock为0.00,/run/user/65534为0.00,/space为76.38,/sys/fs/cgroup为0.00,/是 18.46。

infra :: backup2.infra :: inode 使用百分比 OKs:/dev/shm 为 0.00,/run 为 0.05,/space2 为 7.44,/run/user/65534 为 0.00,/run/lock 为 0.00,/sys/ fs/cgroup 为 0.00,/space 为 0.24,/ 为 8.07,/dev 为 0.03,/home 为 0.13,/mnt/usb1 为 0.51,/export/oxa 为 0.01,/tmp 为 0.02,/var 为 2.02,/运行/用户/1001 是 0.00。

07:00

infra :: backup2.infra :: inode 使用百分比 OKs:/home 为 0.13,/var 为 2.02,/run/user/1001 为 0.00,/dev/shm 为 0.00,/run 为 0.05,/run/lock 为0.00,/space为0.24,/run/user/1003为0.00,/tmp为0.02,/为8.07,/space2为7.44,/mnt/usb1为0.51,/export/oxa为0.01,/dev为0.03,/ sys/fs/cgroup 为 0.00。

08h50

infra :: backup2.infra :: inode 使用百分比 OKs:/run/user/1001 为 0.00,/tmp 为 0.02,/dev 为 0.03,/run/user/0 为 0.00,/dev/shm 为 0.00,/ run 为 0.05,/space 为 0.24,/sys/fs/cgroup 为 0.00,/mnt/usb1 为 0.51,/ 为 8.07,/home 为 0.13,/space2 为 7.44,/run/lock 为 0.00,/var 为 2.02 , /export/oxa 是 0.01。

infra :: backup2.infra :: 磁盘使用百分比 OKs:/ 为 18.46,/mnt/usb1 为 30.62,/sys/fs/cgroup 为 0.00,/export/oxa 为 51.62,/run/lock 为 0.00,/var是 22.29, /space2 是 40.39, /home 是 8.87, /tmp 是 0.60, /run/user/1001 是 0.00, /space 是 76.49, /dev/shm 是 0.00, /run 是 9.27, /run/user/0是 0.00。

一切正常,主日志中没有错误,但我仍然收到了很多这样的消息。

这是有关此节点的 master 上的日志

munin-update.log:2016/03/25 10:40:24 [警告] backup2.infra/backup2.admin2:4949 上的服务 nfs4_client 没有返回标签 fsinfo munin-update.log:2016/03/25 10 的数据: 40:21 [警告] backup2.infra/backup2.admin2:4949 上的服务 nfs_client 没有返回标签删除的数据

munin-update.log:2016/03/25 09:55:06 [INFO] 于 29082 年开始为 backup2.infra/backup2.admin2:4949 工作。munin-update.log:2016/03/25 09:55:06 [INFO] 节点 backup2.infra 将自己宣传为 backup2。munin-update.log:2016/03/25 09:55:12 [INFO]:节点 infra 的 Munin 更新完成;backup2.infra(6.67 秒)munin-update.log:2016/03/25 09:55: 13 [信息] 收割 Munin::Master::UpdateWorker。退出值/信号:0/0

通知配置

 contact.devs.command mail -s "Munin notification ${var:host}" my@mail.com 
 contact.devs.always_send warning critical
Run Code Online (Sandbox Code Playgroud)

这里是这个节点的配置文件(生成,对于所有节点)

[backup2.infra]
     address backup2.admin2
     use_node_name yes
     diskstats_latency.backup2_store_export.avgrdwait.warning :7
     diskstats_latency.backup2_store_export.avgwrwait.warning :7
     diskstats_latency.backup2_store_export.avgrdwait.critical :10
     diskstats_latency.backup2_store_export.avgwrwait.critical :10
Run Code Online (Sandbox Code Playgroud)

Munin Master 和节点版本:2.0.25-1(都是 Debian Jessie)

我在哪里可以看明白和解决?

Oli*_*ver 6

dfDebian 中的插件还会检查动态挂载的文件系统/run/user/<uid>,当用户登录时会在这些文件系统下出现,在用户注销时会消失。即使所有级别都可以,但这种出现和消失被视为触发电子邮件的更改。

您应该能够通过创建一个/etc/munin/plugin-conf.d/df包含以下内容的文件来避免这种情况:

[df*]
env.exclude_re /run/user/
Run Code Online (Sandbox Code Playgroud)

要检查您的设置是否有效并列出df插件考虑的路径,请使用以下命令:

munin-run -d df
Run Code Online (Sandbox Code Playgroud)

如果您对结果感到满意,请重新启动 munin-node 服务 ( service munin-node restart)。