linux – apcupsd slave客户端不断丢失并恢复与UPS主站的通信

在VMWare ESXI 5.0.0(vSphere Hypervisor – 免费版)上,我有三个服务器映像.所有运行的CentOS 6 – Linux.
所有配置都运行apcupsd( http://www.apcupsd.org/)守护进程来控制APC upses.

其中一台服务器(主站)使用USB电缆连接到APC CS 350 UPS.
apcupsd配置为在端口3551上提供netserver.

另外两个(也是虚拟化的)服务器已配置apcupsd以从主服务器检索UPS状态.

它工作,但我看到很多警告来自两个奴隶的apcupsd.在终端窗口中,我看到条目说

Broadcast message from root@slavehostname (Thu Nov 1 19:55:10 2012):

Warning communications lost with UPS masterhostname

Broadcast message from root@slavehostname (Thu Nov 1 19:55:47 2012):

Communications restored with UPS masterhostname

在同一天,我看到大约200套丢失/恢复的消息.它们在白天比在夜间更频繁.

我对主人没有任何警告.

这些服务器有很多可用的内存和cpu.实际上没有发生交换.
我不认为他们饿死了.通常他们不做很多工作.

这是主配置设置(省略EPROM设置)：

UPSCABLE usb
UPSTYPE usb
DEVICE
POLLTIME 10
LOCKFILE /var/lock
SCRIPTDIR /etc/apcupsd
PWRFAILDIR /etc/apcupsd
NOLOGINDIR /etc
ONBATTERYDELAY 6
BATTERYLEVEL 5
MINUTES 3
TIMEOUT 0
ANNOY 300
ANNOYDELAY 60
NOlogoN disable
KILLDELAY 0
NETSERVER on
NISIP 0.0.0.0
NISPORT 3551
EVENTSFILE /var/log/apcupsd.events
EVENTSFILEMAX 10
UPSCLASS standalone
UPSMODE disable
STATTIME 0
STATFILE /var/log/apcupsd.status
LOGSTATS off
DATATIME 0

这是奴隶设置：

UPSCABLE ether
UPSTYPE net       
DEVICE 192.168.0.59:3551
POLLTIME 10
LOCKFILE /var/lock
SCRIPTDIR /etc/apcupsd
PWRFAILDIR /etc/apcupsd
NOLOGINDIR /etc
ONBATTERYDELAY 12
BATTERYLEVEL 10
MINUTES 7
TIMEOUT 0
ANNOY 300
ANNOYDELAY 60
NOlogoN disable
KILLDELAY 0
NETSERVER on
NISIP 0.0.0.0
NISPORT 3551
EVENTSFILE /var/log/apcupsd.events
EVENTSFILEMAX 10
UPSCLASS standalone
UPSMODE disable
STATTIME 20
STATFILE /var/log/apcupsd.status
LOGSTATS off
DATATIME 0

我想请求如何从这里继续前进的帮助.我该如何调试？有关如何以可能导致此问题的方式配置服务器的任何建议.

解决方法

这不能解决潜在的问题,但它有助于清理控制台：

输出这些消息的脚本称为apccontrol,在我的Ubuntu 12.04.02 LTS Boxen中它位于/ etc / apcupsd中.它使用wall来显示所有消息.

但它也调用其他脚本,如果它们存在于该目录中以进行二次处理,例如每次发生通信故障时通过电子邮件发送root.您可以通过移动脚本或更改脚本来关闭它.

另外：如果其他脚本以状态代码99退出,那么apccontrol将不会调用默认操作,并且您不会在墙上发送垃圾邮件.

我刚刚使用它将所有通信丢失警报推送到系统日志而不是墙壁,现在它不会弄乱我正在尝试使用的所有终端.我可以将轮询时间恢复到默认值60,这样我的奴隶盒仍会注意到UPS是否会启动.

linux – apcupsd slave客户端不断丢失并恢复与UPS主站的通信

解决方法

猜你在找的Linux相关文章