Lor*_*one 5 kernel cache intel perf
我发现perf top -e cache-misses:pp -p <my_pid>相当混乱的行为。我拥有一个 Intel i5-3230M,运行内核 4.4.5 64 位。
如果我只运行该命令,我的应用程序中基本上没有样本(具有大型数据集的数值模拟,因此肯定必须显示缓存未命中),但几乎仅从一些内核函数中获取,例如intel_pmu_lbr_enable_all, native_write_msr_safe, native_read_msr_safe, __intel_pmu_lbr_disable。如果我使用 将点击次数限制在用户空间-K,我只会在我的应用程序中获得点击次数,但数量非常少。如果我删除一个“精确” ( p) 修饰符,我会得到更多的命中,但是来自显然不会导致内存加载/写入的操作码。
我应该如何解释这种行为?究竟什么算作“缓存未命中”?
| 归档时间: |
|
| 查看次数: |
863 次 |
| 最近记录: |