linux – perf stat为每次运行提供不同数量的指令

前端之家收集整理的这篇文章主要介绍了linux – perf stat为每次运行提供不同数量的指令前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

我对以下空程序运行了perf分析,

#include dio.h>
int main() {
}

编译并运行perf stat ./a.out后,我得到了以下输出说明(以及其他数据,如周期数,任务时钟等):

418,869 instructions # 0.87 insns per cycle

在同一个精灵的每次’perf’分析期间,指令的数量都会发生变化.

我的实际需要是找到我写的特定函数中的指令数.所以我将从新程序中的指令数减去上面的数字.(我可以计算在gcc中使用-S标签创建的program.s中的行数,但在查看perf行为后我感到困惑)

为什么说明的数量不一致,确切地说不一样?

更新
我按照man page中给出的示例在C中使用perf_event_open()

最佳答案
为了测量你的函数执行的指令数量,我建议在函数的进入和退出时使用perf_event_open()开始和停止事件计数,而不是在有和没有函数的情况下运行两次你的程序.

关于空程序执行的指令数的非确定性,您可能正在计算用户和内核域中的事件.我认为用户的土地数应该在两次运行之间保持不变,但对于内核部分,很多事情都发生在执行这个程序的场景后面,所以我猜非确定性来自于内核代码中发生的事情.要仅计算用户空间指令,您可以使用:

perf stat -e instructions:u a.out

你能否提供有关差异的更多细节?

猜你在找的Linux相关文章