频道导航

c – 在MSVC中自动生成FMA指令

2019-10-09 C&C++ 前端之家

前端之家收集整理的这篇文章主要介绍了c – 在MSVC中自动生成FMA指令，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

MSVC多年来支持AVX / AVX2指令,根据 this msdn blog post,它可以自动生成 fused-multiply-add (FMA)指令.

但是以下两个函数都没有编译为FMA指令：

float func1(float x,float y,float z)
{
    return x * y + z;
}

float func2(float x,float z)
{
     return std::fma(x,y,z);
}

更糟糕的是,std :: fma没有实现为单个FMA指令,它执行速度非常快,比普通的x * yz慢得多(如果实现不依赖于FMA指令,则预期std :: fma的性能很差) .

我用/ arch编译：AVX2 / O2 / Qvec标志.
还尝试用/ fp：快速,没有成功.

所以问题是MSVC如何强制自动发出FMA指令？

UPDATE

有一个#pragma fp_contract (on|off),(看起来像)什么都不做.

解决方法

MSVC 2015确实为标量操作生成fma指令,但不为向量操作生成(除非您明确使用fma内在函数).

我编译了以下代码

//foo.cpp
float mul_add(float a,float b,float c) {
    return a*b + c;
}

//MSVC cannot handle vectors as function parameters so use const references
__m256 mul_addv(__m256 const &a,__m256 const &b,__m256 const &c) {
    return _mm256_add_ps(_mm256_mul_ps(a,b),c);
}

同

cl /c /O2 /arch:AVX2 /fp:fast /FA foo.cpp

在MSVC2015中它产生了以下组件

;mul_add
vmovaps xmm3,xmm1
vfmadd213ss xmm3,xmm0,xmm2
vmovaps xmm0,xmm3

和

;mul_addv
vmovups ymm0,YMMWORD PTR [rcx]
vmulps  ymm1,ymm0,YMMWORD PTR [rdx]
vaddps  ymm0,ymm1,YMMWORD PTR [r8]

上一篇：c – 使用Valgrind的Qt内存泄漏的抑下一篇：在C中模拟thiscall以实现struct函数

猜你在找的C&C++相关文章

C++11新特性的一些用法举例②

/** C+⬑ * 默认成员函数原来C++类中，有6个默认成员函数：构造函数析...

作者：HJfjfK 时间：2024-09-28

C++特殊类的设计与单例模式

#pragma once // 1. 设计一个不能被拷贝的类/* 解析:拷贝只会放生在两个场景中：拷贝构造函...

作者：HJfjfK 时间：2024-09-28

C++11的类型转换

C类型转换 C语言:显式和隐式类型转换隐式类型转化：编译器在编译阶段自动进行，能转就转，...

作者：HJfjfK 时间：2024-09-28

C++异常的基本概念与用法

//异常的概念/*抛出异常后必须要捕获,否则终止程序(到最外层后会交给main管理,main的行为就...

作者：HJfjfK 时间：2024-09-28

C++的智能指针

#pragma once /*Smart pointer 智能指针;灵巧指针智能指针三大件//1.RAII//2.像指针一样使...

作者：HJfjfK 时间：2024-09-28

C++11标准库原子变量 <atomic> 梳理

目录<atomic>原子操作的概念CAS实现原理CAS操作的伪代码：使用CAS完成变量的...

作者：HJfjfK 时间：2024-09-28

C++11新特性的一些用法举例①

//字符串字面量/*常用:1.原始字符串字面量括号内保持原样输出没有转义字符,如n不再是换行...

作者：HJfjfK 时间：2024-09-28

C++11标准库条件变量 <condition_variable> 梳理

目录<condition_variable>condition_variable类类方法生产者消费者模型 -- ...

作者：HJfjfK 时间：2024-09-28

C++11智能指针 unique_ptr、shared_ptr/weak_ptr、make_shared、循环引用、定制删除器 (万字长文)

目录智能指针场景引入 - 为什么需要智能指针？内存泄漏什么是内存泄漏内存泄漏的危害内存泄...

作者：HJfjfK 时间：2024-09-28

/** 多态/动态调用 * * * 1.虚函数/虚拟函数 * 语法:在函数前面加上virtual * * 1.1虚函数...

作者：HJfjfK 时间：2024-09-28

编程分类

PHP Java Java SE Python C#C&C++Ruby VB asp.Net Go Perl netty Django Delphi Jsp .NET Core Spring Flask Springboot SpringMVC Lua Laravel Mybatis Asp Groovy ThinkPHP Yii swoole

最新文章