在基于 linux 的数据中心中检测时间漂移的策略是什么?

Stu*_*ard 15 linux monitoring ntp time

在所有基于 linux 的数据中心中检测时间漂移的策略是什么?这是一个比起初看起来更困难的问题。

时间漂移可能会导致某些应用程序出现严重问题,并且通常即使安装了 NTP,也可能由于以下(以及更多)原因而失败:

  • NTP 未正确设置为在重新启动时自动重新启动。
  • 服务器上的设置不正确,因此它指向的时间服务器无法访问或不准确。
  • 主时间服务器无法访问,所有与其同步的服务器现在都同步到不可靠的源。

我想要一种方法来检测所有单个服务器是否正确。请记住,带有测试脚本/应用程序的服务器可能不正确。

eww*_*ite 20

这很容易控制。配置管理是关键...

确保 ntp 服务正在运行和配置...

例如,使用Monit来确保ntpd正在运行并在它失败时重新启动它是一种简单的方法……将 cron 和其他基本守护程序添加到这种检查中可能是有意义的。

另一种选择是使用像Puppet这样的配置管理工具将相同的 ntpd.conf 强制发送到您的服务器,并确保 ntpd 已安装、配置和运行。

NTP 协议中有足够的冗余来处理无法访问时间服务器的实例。指定多个来源。

  • 请注意,***如何*** 检查 `ntpd` 的状态非常重要。您不想只是说“ntpd 正在运行。一切都很棒!”。您必须实际验证您的系统是否正在同步并具有功能对等点,或者[主机和监控盒之间的时间偏移最小](http://serverfault.com/questions/535533/what-is-the-检测时间漂移的策略基于 linux 的数据中心#comment614382_535534)。Nagios 有 `check_ntp_peer` 和 `check_ntp_time` 来处理,如果你想使用 Nagios。 (4认同)
  • 我必须回应这种情绪。配置管理和多个 NTP 服务器是任何接近“数据中心”的基础设施的基本部分。中型或大型数据中心应该有硬件时钟。GPS 时间源可以花几百美元购买,如果您有一个低于 100 美元的烙铁。 (3认同)

dmo*_*ati 10

有各种用于nagios的 check_ntp 插件。

这是一个:

http://nagiosplugins.org/man/check_ntp

将此检查添加到您的 nagios 主机并在出现任何问题时收到警报。