在云平台上,您经常会听到由于相邻虚拟机的负载过高,磁盘超额预订以太网,备份或实时迁移到其他硬件,虚拟机可能会“冻结”一会儿.
我怀疑这是云计算提供商上的一个Ubuntu虚拟机发生的事情,我不打算公开羞辱.
每天晚上外部监控服务都无法使用.机器本身在负载,流量等方面看起来很健康.提供商建议网络很好.
我希望能够(dis)证明VM冻结导致这些寻呼机.
我的一个想法是每秒将日期写入日志,并在短暂的不可用时刻之后看看我们是否跳过了“节拍”.
然而,这似乎是有缺陷的,因为如果VM保持自己的时钟并允许从主机的硬件漂移.
如果我们的内部时钟与VM一起冻结,那么我们在该日志文件中仍然会有一个很好的秒序列,而现在的时钟却落后于实时.
有没有更好的方法/工具可以用来确定是否存在机器冻结?
我猜想实时,我们的时间将是一个告诉,然后再次,还有其他原因漂移时钟.
我认为你每时每刻都把时间写入日志文件是正确的,但是由于你指出可能不可靠的原因.除了将时间写入本地磁盘之外,为什么不让您的cron进程通过网络连接到已知的稳定系统并让该系统将请求记录到磁盘?假设您正在对系统执行http请求并且系统正在记录请求,那么像wget这样简单的事情就可以工作.当然,理想情况下,您希望目标系统与您怀疑在网络方面存在问题的系统相对“接近”,但这可以帮助您至少获得一些调试数据.