在我专用的CentOS 5.4服务器上,我使用大约十几个虚拟主机配置apache.我测试了一些’em,每个都在大约一秒钟内加载;相当快.负载平均值小于1.没问题.我正在运行静态HTML网站,一个带有MySQL 5.0的wordpress博客……这些不是高带宽网站;什么都不会强调这台服务器.
第二天早上,我上班,加载主站点,加载需要10到20秒.我检查服务器上的负载平均值,它在3左右徘徊,有时高达5,一旦看到它在8,从不低于2.此时我优雅地反弹apache:
# apachectl -k graceful
大约半分钟,然后一切都很好.所有虚拟主机加载速度都快,不到一秒钟.负载平均值快速下降到1以下.
检查/服务器状态时,不是很多;检查网络流量(vnstat -l或vnstat -h)时,没有使用大量带宽.两者在一天开始时都是可比较的.然而,当我在早上检查它时,apache比整天快得多.一夜之间发生了什么让apache放慢速度并消耗了更多的系统资源?
# httpd -V Server version: Apache/2.2.3 # uname -a Linux myserver.com 2.6.18-92.el5 #1 SMP Tue Jun 10 18:51:06 EDT 2008 x86_64 x86_64 x86_64 GNU/Linux # free total used free shared buffers cached Mem: 1025576 1017292 8284 0 8208 43160 -/+ buffers/cache: 965924 59652 Swap: 2096472 361012 1735460
我想我可以设置一个每天优雅地反弹apache的cronjob,但这似乎是一个快速而肮脏的解决方案.我宁愿找到原因并解决这个问题.
更新2009-10-28 14:38;平均每5秒钟取5次采样:
$sar -W 10 30 && date Linux 2.6.18-92.el5 (myserver.com) 10/28/2009 02:32:36 PM pswpin/s pswpout/s 02:32:46 PM 10.31 30.43 02:32:56 PM 2.30 32.93 02:33:06 PM 21.56 0.00 02:33:16 PM 1.80 0.00 02:33:26 PM 5.69 26.67 02:33:36 PM 0.10 0.00 02:33:46 PM 25.70 7.60 02:33:56 PM 10.61 7.11 02:34:06 PM 4.10 2.60 02:34:16 PM 0.70 0.00 02:34:26 PM 0.00 0.00 02:34:36 PM 0.00 0.00 02:34:46 PM 3.80 0.00 02:34:56 PM 0.00 0.00 02:35:06 PM 0.00 11.01 02:35:16 PM 7.70 30.30 02:35:26 PM 20.32 0.00 02:35:36 PM 1.60 0.00 02:35:46 PM 11.60 0.00 02:35:56 PM 2.50 0.00 02:36:06 PM 0.00 0.00 02:36:16 PM 3.60 0.00 02:36:26 PM 0.00 0.00 02:36:36 PM 0.00 0.00 02:36:46 PM 0.00 0.00 02:36:56 PM 445.20 56.60 02:37:06 PM 0.00 0.00 02:37:16 PM 0.00 0.00 02:37:26 PM 0.00 0.00 02:37:36 PM 0.00 0.00 Average: 19.31 6.84 Wed Oct 28 14:37:36 PDT 2009
奇怪的是,阿帕奇今天早上并不慢.昨天我对启动的服务器数量,num备用服务器,最大服务器数量等进行了一些调整.让我得到旧的价值并比较……
来自/etc/httpd/conf/httpd.conf的原始值:
StartServers 20 MinSpareServers 20 MaxSpareServers 120 ServerLimit 256 MaxClients 256 MaxRequestsPerChild 4000
从各方面来看,新的价值似乎都很好:
StartServers 30 MinSpareServers 30 MaxSpareServers 40 ServerLimit 50 MaxClients 50 MaxRequestsPerChild 4000
我可能会继续略微调整这些设置,但它们现在似乎运行良好.
Sar今天早上再次命令:
$sar -W 10 30 && date Linux 2.6.18-92.el5 (myserver.com) 10/29/2009 09:31:09 AM pswpin/s pswpout/s 09:31:19 AM 5.80 54.40 09:31:29 AM 62.10 0.00 09:31:39 AM 0.00 0.00 09:31:49 AM 0.00 0.00 09:31:59 AM 0.00 0.00 09:32:09 AM 3.30 0.00 09:32:19 AM 2.70 0.00 09:32:29 AM 0.00 0.00 09:32:39 AM 0.00 0.00 09:32:49 AM 0.00 0.00 09:32:59 AM 3.10 0.00 09:33:09 AM 5.80 0.00 09:33:19 AM 0.00 0.00 09:33:29 AM 0.00 0.00 09:33:39 AM 0.00 0.00 09:33:49 AM 0.00 0.00 09:33:59 AM 0.00 0.00 09:34:09 AM 0.00 0.00 09:34:19 AM 0.00 0.00 09:34:29 AM 0.00 0.00 09:34:39 AM 4.00 0.00 09:34:49 AM 0.10 0.00 09:34:59 AM 0.00 0.00 09:35:09 AM 4.80 0.00 09:35:19 AM 0.00 0.00 09:35:29 AM 291.29 0.00 09:35:39 AM 0.00 0.00 09:35:49 AM 0.80 0.00 09:35:59 AM 0.00 0.00 09:36:09 AM 0.00 0.00 Average: 12.78 1.81 Thu Oct 29 09:36:09 PDT 2009
平均值实际上更低!服务器的流量比昨天多. Womble,看来你是对的!现在一切都在宇宙中很好.
John Gardeniers,好主意!它有-o [filename]开关.谢谢你的提示!
Jeremy Visser,dstat是一个非常好的工具!谢谢你的提示!它没有安装,不得不安装dstat.