c – 分支或乘法更有效吗?

前端之家收集整理的这篇文章主要介绍了c – 分支或乘法更有效吗?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我正在尝试优化一个小的,高度使用的函数,该函数使用无符号short int中的高位来指示要一起求和的数组值.起初我使用下面显示的明显方法.请注意,循环展开未明确显示,因为它应由编译器完成.
int total = 0;
for(unsigned short mask = 0x0001,j = 0; mask != 0; mask <<= 1,j++){
    if (i & mask){
        total += value[j];
    }
}

但是,后来我认为删除分支以帮助cpu流水线操作可能会更好,并提出以下建议.

int total = 0;
for(unsigned short mask = 0x0001,j++){
    total += ((i & mask) != 0) * value[j];
}

请注意,由于(i& mask)不会产生布尔答案,因此与0的比较会强制结果为1或0.虽然第二种方法代码的这一部分中删除了if语句,但第二种解决方案除了等式的其余部分之外,还需要在每次迭代时运行0或1的乘法.

哪个代码运行得更快?

解决方法

如果没有乘法,你可以使它无分支.看起来对于每个位集,您使用该位位置作为数组的索引.

首先,您可以轻松提取设置的位:

unsigned short set_mask= i & -i;
i&= i - 1;

然后,您可以通过计算(set_mask – 1)中设置的位来获取位索引.这是一个恒定的时间公式.

某些平台也有一个内在函数获取位集的位索引,这可能更快. x86有bsr,PPC有cntlz.

所以答案是无分支无乘版本可能是最快的:)

猜你在找的C&C++相关文章