标签: monitoring

set daemon 10
set logfile /var/log/monit.log
set statefile /var/lib/monit/monit.state
set alert foo@example.com not { nonexist, action, instance }
include /etc/monit/conf.d/*

Run Code Online (Sandbox Code Playgroud)

这是我正在使用的 Monit 规则集的示例：

check process myservice
  with pidfile /var/run/myservice/myservice.pid
  start program = "/home/myservice/current/start-myservice.sh"
    as uid myservice and gid myservice
  stop program = "/home/myservice/current/stop-myservice.sh"
    as uid myservice and gid myservice
  mode active

Run Code Online (Sandbox Code Playgroud)

在我的环境中，我希望它无限期地继续尝试轮询间隔。有没有办法将 monit 配置为从不停止监视服务，即使它没有成功启动？

linux monitoring monit

Joe*_*haw

2015 10-03

8
推荐指数

2
解决办法

6555
查看次数

Nagios 对 WAN 的“监控”是理想的吗？

刚开始在一家新公司工作，我的第一个任务是寻找内部监控系统的替代方案。

他们当前的解决方案是一个 .Net 应用程序，它通过 WAN 检查各种设备（因为他们是一家提供 24/7 支持/“维护”的 IT 咨询公司）。设备范围从路由器/交换机/打印机到 MS 服务器和服务。

在阅读了网站上的无数帖子并在谷歌上广泛搜索之后，似乎一致认为某种 Nagios/Munin 混合是要走的路。

这让我想到了我的问题：

A) 是否可以在公司本地运行 Nagios 服务器并通过 WAN 监控各种外部站点？（他们不希望每个站点都有本地 Nagios 服务器，因为大多数站点相对较小（10-25 台主机）并且站点数量非常大（75-100））。

B) 如果是这样，代理将如何联系 Nagios 后端？通过SSH？HTTP？

C) 除了易受 WAN 链接故障的影响之外，这种解决方案的直接缺点是什么？

感谢任何反馈，我提前为任何误解道歉，因为我对这个行业很陌生。

monitoring nagios

NmE*_*NmE

lucky-day

8
推荐指数

1
解决办法

6334
查看次数

将 runit 与 monit 结合使用有什么意义？

我看到很多人将 monit 与 runit 结合使用。那不是多余的吗？使用 runit 又有什么意义呢？是不是因为它在处理服务时更可靠（因为它不依赖于 pidfiles）？

谢谢！

linux unix monitoring monit runit

Mil*_*ota

2012 08-27

8
推荐指数

1
解决办法

1895
查看次数

何时更新即将到期的 SSL 证书的常见做法是什么？

最近 Windows Azure 存储 SSL 证书过期，这导致了很多问题。现在，任何用户都可以检索该证书，因此每个人都可能注意到它即将过期。

现在更换即将到期的证书的典型时间范围是多少？是到期前一个月还是到期前一周或任何其他时间？

换句话说，假设我正在验证第三方服务证书并看到它在 N 天后过期。如果我提前一天注意到它可能为时已晚 - 我需要时间联系服务所有者，他们需要时间重新颁发证书并更换它。如果我提前一个月注意到 - 现在发出警报可能还为时过早 - 也许服务所有者将稍后更换证书。

N 的值是多少，如果 SSL 证书将在 N 天后到期，则服务所有者很可能已经忘记了它的到期时间？何时更新即将到期的 SSL 证书的常见做法是什么？

monitoring ssl ssl-certificate

sha*_*oth

2017 05-23

8
推荐指数

3
解决办法

1674
查看次数

HDD SMART 数据的可靠性如何？

根据SMART数据，你可以判断一个磁盘的健康状况，至少是这个想法。例如，如果我sudo smartctl -H /dev/sda在我的 ArchLinux 笔记本电脑上运行，它会说硬盘驱动器通过了自检，并且基于此它应该是“健康的”。

我的问题是这些信息有多可靠，或者更具体地说：

如果根据 SMART 数据该磁盘是健康的，尽管如此，该磁盘突然发生故障的几率是多少？这假设故障不是由于某些无法预测的灾难性事件造成的，例如笔记本电脑掉在地板上导致驱动器磁头撞击磁盘。
如果 SMART 数据没有表明磁盘状况良好，那么磁盘在一段时间内发生故障的几率是多少？是否有可能出现误报以及这些误报有多普遍？

当然，无论如何我都会备份。我主要是好奇。

monitoring hard-drive smart

and*_*lst

lucky-day

8
推荐指数

1
解决办法

1万
查看次数