我在KVM虚拟机中运行了SPECJbb基准测试.它显示仓库2和仓库3之间的吞吐量急剧下降(它们之间的差异只是在并行任务上添加)
然后我在我的来宾虚拟机中使用perf.它表明_spin_unlock_irqrestore具有非常高的采样率.
事件:31K周期
74.89%[内核] [k] _spin_unlock_irqrestore
7.36%perf-1968.map [.] 0x7f84b913e064
6.82%[内核] [k] __do_softirq
6.39%[kernel] [k] handle_IRQ_event
...
似乎只有7.36%的cpu时间运行我的Java程序.为什么_spin_unlock_irqrestore的采样率如此之高?它做了什么?
这是糟糕的报告perf,而不是消耗的周期_spin_unlock_irqrestore.
禁用IRQ时,不会处理perf的中断.相反,它们在重新启用中断时被处理.当perf的中断处理程序查看指令指针时,为了查看正在运行的代码,它会找到启用中断的函数 - 通常是这样_spin_unlock_irqrestore.
所有你知道的是,循环被禁用了中断的代码消耗,并使用它们启用它们_spin_unlock_irqrestore.
如果你可以使用perf来使用NMI(不可屏蔽中断),它可以解决这个问题.
我知道可以通过更改makefile来完成oprofile(perf的前身),但不知道perf.