#include <cstdio> #include <cmath> const int COUNT = 1000000000; int main() { double sum = 0; for (int i = 1; i <= COUNT; ++i) { sum += sqrt(i); } printf("%f\n",sum); return 0; }
没有-O2,它在我的电脑上运行只有2.9s,而运行6.4s与-O2.
我的电脑是Fedora 23,g 5.3.1.
我在Ubuntu 14.04(与g 4.8)一样尝试过同样的事情,它没有问题(全部6.4s).
优化版本使用SSE sqrtsd指令.但是在指令完成之后,它检查结果值不是NaN.如果结果值是NaN,那么它调用glibc sqrt函数来设置正确的错误标志(参见math_error(7)的手册页).详见Why does compiler generate additional sqrts in the compiled assembly code.
为什么gcc认为这样更快?没人知道.如果您确定您的数字不生成NaN,请使用-fno-math-errno compile选项.