我试图将两个向量相乘,一个向量的每个元素乘以另一个向量的同一索引中的元素.然后我想要求结果矢量的所有元素得到一个数字.例如,向量{1,2,3,4}和{5,6,7,8}的计算将如下所示:
1 * 5 2 * 6 3 * 7 4 * 8
本质上,我正在采取两个向量的点积.我知道有一个SSE命令来执行此操作,但该命令没有与之相关联的内在函数.在这一点上,我不想在我的C代码中编写内联汇编,所以我只想使用内在函数.这似乎是一个常见的计算方法,所以我对自己感到惊讶,我在Google上找不到答案.
注意:我正在针对支持SSE 4.2的特定微架构进行优化.
谢谢你的帮助.
GCC(至少版本4.3)
包括< smmintrin.h>具有SSE4.1级内在
功能,
包括单精度和双精度点产品:
_mm_dp_ps (__m128 __X,__m128 __Y,const int __M);
_mm_dp_pd (__m128d __X,__m128d __Y,const int __M);
作为旧处理器的回退,您可以使用此算法创建向量a和b的点积:
r1 = _mm_mul_ps(a,b);
r2 = _mm_hadd_ps(r1,r1);
r3 = _mm_hadd_ps(r2,r2);
_mm_store_ss(&result,r3);