我在热点代码中有一个虚函数,需要返回一个结构.我有这两个选项:
virtual Vec4 generateVec() const = 0; // return value virtual void generateVec(Vec4& output) const = 0; // output parameter
我的问题是,这些功能的性能通常有什么不同吗?我假设第二个更快,因为它不涉及在堆栈上复制数据.但是,第一个通常使用起来更方便.如果第一个仍然稍微慢一点,那么它是否可以测量?我太痴迷了:)
解决方法
如前所述,尝试一下 – 但你很可能会发现Vec4 generateVec()实际上更快.
Return value optimization将是
elide the copy operation,而void generateVec(Vec4& output)可能导致输出参数的不必要的初始化.