_spin_unlock_irqrestore()在我的kvm中有很高的采样率,为什么？

Question

我在KVM虚拟机中运行了SPECJbb基准测试.它显示仓库2和仓库3之间的吞吐量急剧下降(它们之间的差异只是在并行任务上添加)

然后我在我的来宾虚拟机中使用perf.它表明_spin_unlock_irqrestore具有非常高的采样率.

事件:31K周期

...

似乎只有7.36%的cpu时间运行我的Java程序.为什么_spin_unlock_irqrestore的采样率如此之高？它做了什么？

Answer 1

这是糟糕的报告perf,而不是消耗的周期_spin_unlock_irqrestore.

禁用IRQ时,不会处理perf的中断.相反,它们在重新启用中断时被处理.当perf的中断处理程序查看指令指针时,为了查看正在运行的代码,它会找到启用中断的函数 - 通常是这样_spin_unlock_irqrestore.

所有你知道的是,循环被禁用了中断的代码消耗,并使用它们启用它们_spin_unlock_irqrestore.

如果你可以使用perf来使用NMI(不可屏蔽中断),它可以解决这个问题.
我知道可以通过更改makefile来完成oprofile(perf的前身),但不知道perf.