我需要在64位cpu上取一个8位数字并将其向右移动8次.每次我移动数字我需要在它后面移动相同的8位数,这样我最终会重复8次相同的8位数.这最终会转移,增加8,转移加8等等,最终是40个周期(如果我错了,请纠正我).
有没有办法在1个循环中执行此操作(移位和复制),以便最终得到相同的值?
long _value = 0; byte _number = 7; for (int i = 0; i < 8; i++) { _value = (_value << 8) + _number; }
编辑:我正在尝试比较一组字符来检测关键字.我不能使用string.contains,因为字符串值可能跨越缓冲区的边界.此外,该应用程序必须在嵌入式ARM cpu以及桌面和服务器cpu上运行.内存使用和cpu周期非常重要.
解决方法
另一个想法是预先计算所有字节值的查找表.
var lu = new long[256]; // init var n = 7; var v = lu[n];
更新
一些基准测试结果(以每100000000次迭代的毫秒数为单位):
>循环:272
>展开:207
>不安全:351
>查询:250
> HenkH:216
展开的版本是:
long _value = 0; byte _number = 7; _value = (_value + _number) << 8; _value = (_value + _number) << 8; _value = (_value + _number) << 8; _value = (_value + _number) << 8; _value = (_value + _number) << 8; _value = (_value + _number) << 8; _value = (_value + _number) << 8; _value = (_value + _number) << 8;
不安全的版本是:
long _value = 0; byte _number = 7; byte* p = (byte*)&_value; *p++ = _number; *p++ = _number; *p++ = _number; *p++ = _number; *p++ = _number; *p++ = _number; *p++ = _number; *p++ = _number;
可悲的是没有表演:(
查找只是对数组的读取.
全部编译为x64 / release.