此外,假设循环中的所有操作完全独立于其他迭代,编译器如何确定展开循环的程度.
解决方法
对于MSVC,只有一个向量独立提示:
http://msdn.microsoft.com/en-us/library/hh923901.aspx
#pragma loop( ivdep )
对于许多其他编译器,如Intel/ibm,有几个用于优化循环的pragma提示:
#pragma unroll #pragma loop count N #pragma ivdep
与MSVC人员有一个关于展开启发式的线程:http://social.msdn.microsoft.com/Forums/en-US/vcgeneral/thread/d0b225c2-f5b0-4bb9-ac6a-4d4f61f7cb17/
VC tries to balance execution speed and code size. You can change the balance by using flags /O1 or /O2,but even when optimzing for speed VC tries to conserve code size as well.
基本上,展开会增加代码大小,因此在Os和O1模式下可能会受到限制(modes table)
PS:Pragma看起来像预处理器指令,但事实并非如此.它是编译器的指令,它被预处理器忽略(保留).