在所有基于
Linux的数据中心中检测时间漂移的策略是什么?这是一个比起初看起来更难的问题.
时间漂移可能会导致某些应用程序出现严重问题,并且通常即使安装了NTP,也可能因以下(以及更多)原因而失败:
> NTP未正确设置为在重新启动时自动重新启动.
>服务器上的设置不正确,因此它指向的时间服务器无法访问或不准确.
>主时间服务器无法访问,所有服务器正在与它同步,现在正在同步到不可靠的源.
我想要一种方法来检测所有单个服务器是否正确.请记住,带有测试脚本/应用程序的服务器可能不正确.
解决方法
这很容易控制.配置管理是关键……
确保ntp服务正在运行并配置…
例如,使用Monit来确保ntpd正在运行并且如果它失败则重新启动它是一种简单的方法……将cron和其他必需的守护进程添加到那种检查中可能是有意义的.
另一个选择是使用像Puppet这样的configuration management工具强制将相同的ntpd.conf强制到您的服务器,并确保安装,配置和运行ntpd.
NTP协议中有足够的冗余来处理时间服务器无法访问的实例.指定多个来源.