系统停机通知服务

Bil*_*ver 7 hosting

当我们安排系统维护,或者系统停机或运行缓慢时,我们会向客户发送通知。我们使用多种通信方式(电子邮件、网站状态消息、推特、博客条目、电话)。这种方法的问题在于,这些服务要么由我们托管,要么需要我们的互联网连接有用。

上周我们遭遇了重大失败。我没有所有详细信息,但简而言之,T1 出现故障并且故障转移失败。电子邮件、电话、互联网、ftp 都关闭了。

我是一名程序员,我建议我构建一个实用程序,通过一个简单的 Web 界面自动执行大部分通知任务。如果我们在内部托管它并且我们失败了,这没有好处。我们需要将通知服务移到异地某处。

我担心这样做是因为如果系统通知开始来自另一个域,人们会摸不着头脑;有些人甚至可能无视警报。

有什么建议?

Tim*_*Tim 3

您是否可以将通知软件托管在另一个位置/另一个 Internet 连接上的另一台主机上,但将其解析为当前域的子域?例如,如果您当前在 example.com 上进行监控,则可以将服务移至 monitor.example.com 并开始从那里发送通知。

至于实用程序,您可以考虑Nagios - 它是一套相当完整的监控工具,可以监控 Web 服务、FTP、电子邮件等工作。您可以单独托管它,只需配置所有主要服务以将状态发送到 Nagios 主机,然后将 Nagios 配置为在一段时间内没有收到主站点的消息或主站点开始意外运行时发送警报。