我试图测量具有多个(物理)处理器的(Intel Xeon)机器上的某些硬件事件.具体来说,我想知道为读取’offcore’数据发出了多少请求.
我在Intels文档中找到了the OFFCORE_REQUESTS硬件事件,它给出了事件描述符0xB0和数据需求,附加掩码0x01.
然后告诉perf记录事件0xB1(即0xB0 | 0x01)并将其称为:
perf record -e r0B1 ./mytestapp someargs
或者这是不正确的?
因为perf报告显示没有像这样输入的事件的输出.
这个领域的perf文档相当稀疏,除了tutorial entry之外没有说明它是哪个事件(尽管这个对我有用),或者它是如何编码的……
任何帮助是极大的赞赏.
解决方法
好的,所以我想我明白了.
对于我使用的Intel机器,格式如下:
<&umask的GT;< eventselector>其中两者都是十六进制值.可以删除umask的前导零,但不能删除事件选择器.
因此,对于带有掩码0x01的事件0xB0,我可以调用:
perf record -e r1B0 ./mytestapp someargs
我无法在perf内核代码中找到它的确切解析(这里有任何内核黑客?),但我找到了这些来源:
> the c’t magazine 13/03 (subscription required)中使用perf与原始事件的描述,其中描述了一些原始事件及其描述来自英特尔架构软件开发人员Manuel(第3b卷)
> kernel mailing list上的一个补丁,讨论了记录它的正确方法.它指出上面的模式是“…… x86具体而且不完整”
>(更新)较新版本的手册页显示了Intel机器上的示例:man perf-list
更新:正如评论中指出的那样(谢谢!),libpfm转换器可用于获取正确的事件描述符.用户’osgx’发现的评论中链接的网站(Bojan Nikolic:如何监控所有cpu性能事件)更详细地解释了它.