我们遇到的问题是我们的
Linux机箱(Ubuntu 10.04 LTS,在EC2上运行,具有四倍大尺寸,68GB内存和8个虚拟内核,每个3.25GHz)每隔几秒钟冻结一次.键入ssh会话将冻结,并且正在运行的Postgresql进程之一上运行strace通常会显示:
02:37:41.567990 semop(7831581,{{3,-1,0}},1
在它继续前几秒钟(它总是卡在那个semop).
OProfile显示大部分时间花在内核中(60%)而Postgresql中则花费37%.
这些停顿(一天前突然开始)的结果是盒子上的负载从0.7变为10,并导致整个堆栈减速.
关于如何追踪正在发生的事情的任何想法? iostat没有显示磁盘特别慢或过载,并且顶部显示用户cpu%在这些备份发生时从8%飙升到大约40%.