所有配置都运行apcupsd( http://www.apcupsd.org/)守护进程来控制APC upses.
其中一台服务器(主站)使用USB电缆连接到APC CS 350 UPS.
apcupsd配置为在端口3551上提供netserver.
另外两个(也是虚拟化的)服务器已配置apcupsd以从主服务器检索UPS状态.
它工作,但我看到很多警告来自两个奴隶的apcupsd.在终端窗口中,我看到条目说
Broadcast message from root@slavehostname (Thu Nov 1 19:55:10 2012):
Warning communications lost with UPS masterhostname
Broadcast message from root@slavehostname (Thu Nov 1 19:55:47 2012):
Communications restored with UPS masterhostname
在同一天,我看到大约200套丢失/恢复的消息.它们在白天比在夜间更频繁.
我对主人没有任何警告.
这些服务器有很多可用的内存和cpu.实际上没有发生交换.
我不认为他们饿死了.通常他们不做很多工作.
这是主配置设置(省略EPROM设置):
UPSCABLE usb UPSTYPE usb DEVICE POLLTIME 10 LOCKFILE /var/lock SCRIPTDIR /etc/apcupsd PWRFAILDIR /etc/apcupsd NOLOGINDIR /etc ONBATTERYDELAY 6 BATTERYLEVEL 5 MINUTES 3 TIMEOUT 0 ANNOY 300 ANNOYDELAY 60 NOlogoN disable KILLDELAY 0 NETSERVER on NISIP 0.0.0.0 NISPORT 3551 EVENTSFILE /var/log/apcupsd.events EVENTSFILEMAX 10 UPSCLASS standalone UPSMODE disable STATTIME 0 STATFILE /var/log/apcupsd.status LOGSTATS off DATATIME 0
这是奴隶设置:
UPSCABLE ether UPSTYPE net DEVICE 192.168.0.59:3551 POLLTIME 10 LOCKFILE /var/lock SCRIPTDIR /etc/apcupsd PWRFAILDIR /etc/apcupsd NOLOGINDIR /etc ONBATTERYDELAY 12 BATTERYLEVEL 10 MINUTES 7 TIMEOUT 0 ANNOY 300 ANNOYDELAY 60 NOlogoN disable KILLDELAY 0 NETSERVER on NISIP 0.0.0.0 NISPORT 3551 EVENTSFILE /var/log/apcupsd.events EVENTSFILEMAX 10 UPSCLASS standalone UPSMODE disable STATTIME 20 STATFILE /var/log/apcupsd.status LOGSTATS off DATATIME 0
我想请求如何从这里继续前进的帮助.我该如何调试?有关如何以可能导致此问题的方式配置服务器的任何建议.
解决方法
输出这些消息的脚本称为apccontrol,在我的Ubuntu 12.04.02 LTS Boxen中它位于/ etc / apcupsd中.它使用wall来显示所有消息.
但它也调用其他脚本,如果它们存在于该目录中以进行二次处理,例如每次发生通信故障时通过电子邮件发送root.您可以通过移动脚本或更改脚本来关闭它.
另外:如果其他脚本以状态代码99退出,那么apccontrol将不会调用默认操作,并且您不会在墙上发送垃圾邮件.
我刚刚使用它将所有通信丢失警报推送到系统日志而不是墙壁,现在它不会弄乱我正在尝试使用的所有终端.我可以将轮询时间恢复到默认值60,这样我的奴隶盒仍会注意到UPS是否会启动.