我们可以使用英特尔的性能计数器来衡量成功的存储转发吗?

Bee*_*ope 5 performance x86 intel-pmu

是否可以使用最近的Intel x86芯片上的性能计数器来衡量成功的存储转发操作的数量?

我看到ld_blocks.store_forward哪些措施无法存储转发的事件,但我很清楚是否可以测量成功案例.

Had*_*ais 2

没有记录的事件来计算成功的存储转发操作的数量。然而,我已经在 Haswell 和 Broadwell 上通过实验确定了一组未记录的事件。特别是,事件代码为 0x2 且 umask 为奇数(任何奇数,例如 1)的任何事件似乎都非常准确地表示成功存储转发的事件,即计数符合预期且标准偏差实际上为零。我认为您可以在以后(甚至更早)的微架构上使用相同的事件。同样,这些事件都没有被记录下来。