我发布了apache.一切都在一周前开始(所以这可能与最新的系统更新有关) – 我的监控工具给我发了关于非工作网站的短信.我已经检查过了,看起来像要求微不足道的cgi(在perl中实现)花了30秒.重新启动apache后,问题在接下来的几个小时/天内得到修复,然后再次发生.
最初我怀疑是PHP,因为它只是更新(5.3.15-> 5.3.18),这可能会影响apache.我试图将它重新放回到5.3.15,但这不会解决这个问题.
接下来,我做了strace,看起来像clone()系统调用时出现延迟:
[pid 26659] 1356268557.675934 clone( <unfinished ...> [pid 26659] 1356268587.684401 <... clone resumed> child_stack=0,flags=CLONE_CHILD_CLEARTID|CLONE_CHILD_SETTID|SIGCHLD,child_tidptr=0xa1033768) = 32169 <30.008452>
cgi本身在此之后运行并且运行正常且快速:
[pid 32169] 1356268587.686614 execve("/var/www/mysite.com/mycgi.cgi",["/var/www/mysite.com/mycgi.cgi"],[/* 26 vars */]) = 0 <0.000776>
有什么想法可能会发生吗?克隆(2)如何以及为何可以阻止30秒?!并且在那之后成功返回…它看起来像clone()中的一些超时因为它总是正好30秒.
我使用的是最新的Hardened Gentoo Linux,内核3.5.4-hardened-r1,apache 2.2.23(prefork,mod_cgi).
更新:我可能应该添加:此服务器没有高负载. Apache孩子只使用大约120/40 MB(VIRT / RSS).服务器有2GB RAM,只使用400MB(没有缓冲区/缓存).
解决方法
这是因为CONFIG_GRKERNSEC_BRUTE = y内核选项.