首先让我说我被禁止在我们的 Ubuntu 服务器上启用自动更新,用于安全和常规包。
当我登录到我的四个 Ubuntu 服务器中的任何一个时,欢迎消息包含以下内容:
39 packages can be updated.
26 updates are security updates.
Run Code Online (Sandbox Code Playgroud)
但是,当我运行监控 APT 的 Nagios 插件时,我得到:
% /usr/lib/nagios/plugins/check_apt
APT WARNING: 33 packages available for upgrade (0 critical updates).
Run Code Online (Sandbox Code Playgroud)
我需要知道如何正确检测有待处理的安全更新和定期更新。一旦我能做到这一点,我计划编写一个 Nagios 脚本,该脚本将对挂起的定期更新返回WARNING,对挂起的安全更新返回CRITICAL。
有谁知道如何检测这两个条件?
我正在考虑使用Prometheus来监控我的系统。该文档解释了我如何将其用于指标监控,如计数器、直方图和摘要。但它没有提供关于如何监控我的服务或端点的简单可用性的任何信息。nagios 对 http 检查所做的事情。有什么办法可以配置 Prometheus 为您做简单的 http 检查吗?
我们使用 Nagios 来监控我们的服务器。我自己没有设置过,我想更改一些设置。大多数服务都启用了设置痴迷。我想知道这是什么意思,如果我禁用它会发生什么。
我想做一个设置来动态监控我的 Wifi 网络上的工作站。我的名称服务器 BIND 和 dhcpd 服务器都在 linux 下完美运行。但是当 dhcp 为机器提供 IP 时,我没有找到任何执行脚本的选项。我想知道是否有办法做到这一点。如果没有选项,我将使用日志文件。
我已经在三台服务器上完成了 Nagios 的安装和设置,以便服务器A上的实例也为服务器B和C(通过 NRPE)提供报告。
SSHD 有意侦听每个主机上的不同端口,因此我编辑了每个主机上的 /etc/nagios3/conf.d/services_nagios2.cfg 文件以测试适当的端口。服务器B和C上 Nagios 的本机 HTTP 实例确认 SSH 正在运行,但服务器A上的报告显示B和C上的 SSH 出现严重故障。
我的印象是 NRPE 服务旨在在远程主机上运行本地检查,将其余部分转发回监控主机,然后将数据整理成一份报告,供所有机器使用。
查看配置网页的服务部分(在服务器A 上),Nagios 正在所有三台服务器上测试相同的 SSH 端口,而不是B和C上的不同端口。谁能解释为什么?
我可以纠正这个(迄今为止)的唯一方法是为服务器A上的 conf.d/services_nagios2.cfg 文件中的每个远程主机创建一个不同的主机 group_name 和 check_command 。
这不能是唯一的方法吗?
每次远程监控的服务器需要不同的服务配置时,文件的长度肯定会成倍增加!
我最近在 Debian 9 上安装了 nagios,但不知道如何定义状态。
我有一个 shellscript,它确定进程是否正在运行,如果为 true,则回显“1”,如果为 false,则回显“0”
Nagios 确实处理了该信息,并在“状态信息”中显示 1 或 0,但无论是 0 还是 1 Nagios 都会表示 OK。
我如何定义 Nagios 如果为 0 则状态为“严重”,如果为 1 则状态为“正常”?
nagios ×6
linux ×4
monitoring ×3
bash ×1
bind ×1
debian ×1
dhcp-server ×1
shell ×1
shell-script ×1
ubuntu ×1