在我公司的基础设施中,远程位置有5个数据中心.
@H_301_1@在每个远程位置,有一对服务器保存DNS和NTP服务,并在该位置的每台服务器上配置,以从这两个服务器获取DNS和NTP呼叫.
@H_301_1@所有服务器都是CentOS 6.x机器.
@H_301_1@在DNS和NTP方面,有动力在这两个服务器之间创建冗余.
@H_301_1@DNS部分已涵盖,我只有NTP问题.
@H_301_1@确保当一个NTP服务器发生故障时,第二个/其他服务器将继续为客户端提供服务的正确方法是什么?
@H_301_1@我已经谷歌了解它并找到一个RedHat solution将其中一个服务器设置为主服务器(通过在客户端中将其配置为“true”)但是如果“真正的”(主)服务器失败…那么它失败,客户端不会从中获取NTP更新,因此它不是纯粹的冗余解决方案.
@H_301_1@我想知道是否有人有配置这种解决方案的经验?
@H_301_1@编辑#1:
@H_301_1@为了测试MadHatter的答案,我做了以下几点:
输出为:
- I’ve stopped NTPd on the server which is configured as “preferred” on each one of the NTP clients.
- I’m waiting for the NTP client to stop working against this server and start working against it’s partner NTPd server.
- I’m running
ntpq -p
on the client to see the change. This is the output ofntpq -p
:
[root@ams2proxy10 ~]# ntpq -p remote refid st t when poll reach delay offset jitter ============================================================================== 10.X.X.38 .INIT. 16 u - 128 0 0.000 0.000 0.000 *10.X.X.39 131.211.8.244 2 u 2 64 377 0.123 0.104 0.220@H_301_1@什么是“在ntpq中”?请问哪个命令? @H_301_1@编辑#2:
输出为:
[root@ams2proxy10 ~]# ntpq ntpq> as ind assid status conf reach auth condition last_event cnt =========================================================== 1 64638 8011 yes no none reject mobilize 1 2 64639 963a yes yes none sys.peer sys_peer 3 ntpq>@H_301_1@pe的输出:
ntpq> pe remote refid st t when poll reach delay offset jitter ============================================================================== 10.X.X.38 .INIT. 16 u - 512 0 0.000 0.000 0.000 *10.X.X.39 131.211.8.244 2 u 36 64 377 0.147 0.031 18874.7 ntpq>
我怀疑这是一个无问题:NTP已经具备了这一能力.
@H_301_1@您没有“主”NTP服务器和一些辅助服务器:您有一组已配置的服务器. NTPd将决定哪个是可靠的,哪个最有可能提供良好的时间信号,并且它将不断重新评估其决策.
@H_301_1@这是过去一个月左右我的NTP池服务器的绑定集:
@H_301_1@
@H_301_1@正如你所看到的,大多数时候状态6(系统对等体)被绿线ntp0.jonatkins.com占用,这是我与权限绑定的第1层服务器(我所有的其他服务器都是第2层,所以如果没有其他因素适用,NTPd更喜欢更高层的服务器).
@H_301_1@但是你可以在第44周早些时候看到该线下降,图像下方的数值证实,在图表期间,ntp0.jonatkins.com跌至状态4(outlyer),而linnaeus.inf.ed. ac.uk,其大部分时间都在州5(候选人),但仍然达到6(系统同行). (线路不会一直下降到4 /最多6,因为这些是5分钟原始数据的2小时平均值;大概发生的事情明显持续不到2小时,因此已经过平滑.)
@H_301_1@这表明,在我没有任何意见的情况下,NTPd在某些时候决定其通常的同行不够可靠,并在“停电”期间选择了最佳替代来源.一旦其首选对等体再次通过其内部QA测试,它就恢复到对等状态.
原文链接:https://www.f2er.com/centos/373806.html