我们的数据中心面临着一个奇怪的问题.我们的备份服务器(运行EMC Networker)在凌晨3:00左右每隔一天丢失一次网络连接(备份计划从午夜开始).中断2小时后,网络连接会自动恢复并恢复正常.
我们观察到的:
它不太可能是网络问题,因为它直接连接到服务器场交换机(没有任何中间跃点的第2层连接).此外,服务器连接到两个不同的交换机,以使用Broadcomm Teaming进行负载平衡.
a)如果是与交换机相关的问题,则两个网络端口都不可能断开,因为它们连接到不同的交换机.
b)由于同一个Vlan中的其他设备都很好,因此也排除了Vlan广泛问题的可能性.
c)交换机接口状态始终为up.但是在中断期间有很多数据包丢失 – 可归因于备份服务器的高接口利用率(接近100%)
d)恢复连接,网络没有任何变化.
下一个疑问是Windows服务器上的资源利用率. cpu和内存都很少超过80%,但NIC卡利用率却高得惊人(接近100%)
不确定如何调查这个?