Pat*_*ick 6 linux profiling intel perf
我试图测量具有多个(物理)处理器的(Intel Xeon)机器上的某些硬件事件.具体来说,我想知道为读取'offcore'数据发出了多少请求.
我在Intels文档中找到了OFFCORE_REQUESTS硬件事件,它给出了事件描述符0xB0和数据需求,附加掩码0x01.
然后告诉perf记录事件0xB1(即0xB0 | 0x01)并将其称为:
perf record -e r0B1 ./mytestapp someargs
Run Code Online (Sandbox Code Playgroud)
或者这是不正确的?因为perf report这样输入的事件没有显示输出.
这个领域的perf文档相当稀疏,除了一个教程条目,它没有说明它是哪个事件(尽管这个对我有用),或者它是如何编码的......
任何帮助是极大的赞赏.
Pat*_*ick 13
好的,所以我想我明白了.
对于我使用的Intel机器,格式如下:
<umask><eventselector>两者都是十六进制值.可以删除umask的前导零,但不能删除事件选择器.
所以对于0xB0带面具的事件0x01我可以打电话:
perf record -e r1B0 ./mytestapp someargs
Run Code Online (Sandbox Code Playgroud)
我无法在perf内核代码中找到它的确切解析(这里有任何内核黑客?),但我找到了这些来源:
man perf-list更新:正如评论中指出的那样(谢谢!),libpfm转换器可用于获取正确的事件描述符.用户'osgx'发现的评论中链接的网站(Bojan Nikolic:如何监控所有CPU性能事件)更详细地解释了它.
| 归档时间: |
|
| 查看次数: |
4763 次 |
| 最近记录: |