我在低成本托管服务中租用
a dedicated server(使用Intel Haswell cpu和自定义硬件),并将其与CentOS 6.4 / 64位Linux(带有内核:2.6.32-358.14.1.el6.x86_64)一起使用.
它每隔几周就会挂起,而其他客户似乎也有类似的问题.
在dmesg输出中我看到(这里是the full dmesg output):
cpu0: Intel(R) Core(TM) i7-4770 cpu @ 3.40GHz stepping 03 .... NMI watchdog enabled,takes one hw-pmu counter. .... iTCO_wdt: Intel TCO WatchDog Timer Driver v1.07rh iTCO_wdt: Found a Lynx Point TCO device (Version=2,TCOBASE=0x1860) iTCO_wdt: initialized. heartbeat=30 sec (nowayout=0)
在进程列表中我看到:
# ps uawwwx|grep [w]atchdog root 6 0.0 0.0 0 0 ? S Aug22 0:00 [watchdog/0] root 10 0.0 0.0 0 0 ? S Aug22 0:00 [watchdog/1] root 14 0.0 0.0 0 0 ? S Aug22 0:00 [watchdog/2] root 18 0.0 0.0 0 0 ? S Aug22 0:00 [watchdog/3] root 22 0.0 0.0 0 0 ? S Aug22 0:00 [watchdog/4] root 26 0.0 0.0 0 0 ? S Aug22 0:00 [watchdog/5] root 30 0.0 0.0 0 0 ? S Aug22 0:00 [watchdog/6] root 34 0.0 0.0 0 0 ? S Aug22 0:00 [watchdog/7]
这是否意味着,硬件看门狗已在我的服务器上处于活动状态,并将在30秒内冻结我的机器?
(在/etc/sysctl.conf中我已经把kernel.panic = 10,所以它不再停留在kdb控制台中了).
或者我是否必须安装并启动CentOS软件包看门狗?