如何在所有CPU上执行一段内核代码?

Rus*_*lan 2 multiprocessing linux-kernel msr

我正在尝试创建一个内核模块来为x87 FPU启用FOP兼容模式.这是通过设置IA32_MISC_ENABLEMSR中的位2来完成的.这是代码:

#include <linux/init.h>
#include <linux/module.h>
#include <linux/kernel.h>
#include <asm/msr-index.h>
#include <asm/msr.h>

MODULE_LICENSE("GPL");
MODULE_AUTHOR("10110111");
MODULE_DESCRIPTION("Module to enable FOPcode compatibility mode");
MODULE_VERSION("0.1");

static int __init fopCompat_init(void)
{
   unsigned long long misc_enable=native_read_msr(MSR_IA32_MISC_ENABLE);
   printk(KERN_INFO "Before trying to set FOP_COMPAT, IA32_MISC_ENABLE=%llx,"
                    " i.e. FOP_COMPAT is %senabled\n"
                    ,misc_enable,misc_enable&MSR_IA32_MISC_ENABLE_X87_COMPAT?"":"NOT ");

   wrmsrl(MSR_IA32_MISC_ENABLE,misc_enable|MSR_IA32_MISC_ENABLE_X87_COMPAT);
   misc_enable=native_read_msr(MSR_IA32_MISC_ENABLE);

   printk(KERN_INFO "Tried to set FOP_COMPAT. Result: IA32_MISC_ENABLE=%llx,"
                    " i.e. FOP_COMPAT is now %senabled\n"
                    ,misc_enable,misc_enable&MSR_IA32_MISC_ENABLE_X87_COMPAT?"":"NOT ");
   return 0;
}

static void __exit fopCompat_exit(void)
{
   const unsigned long long misc_enable=native_read_msr(MSR_IA32_MISC_ENABLE);
   printk(KERN_INFO "Quitting FOP-compat with IA32_MISC_ENABLE=%llx\n",misc_enable);
   if(!(misc_enable & MSR_IA32_MISC_ENABLE_X87_COMPAT))
       printk(KERN_INFO "NOTE: seems some CPUs still have to be set up, "
                        "or compatibility mode will work inconsistently\n");
   printk(KERN_INFO "\n");
}

module_init(fopCompat_init);
module_exit(fopCompat_exit);
Run Code Online (Sandbox Code Playgroud)

它似乎工作,但在多个insmod/rmmod周期我有时得到dmesg兼容模式仍未启用的输出,虽然它是在做完后立即wrmsr.经过一番思考后,我意识到这是因为模块代码是在不同的逻辑CPU上执行的(我的Core i7有4个核心*HT = 8个逻辑CPU),所以我有1/8的机会获得"启用"打印rmmod.在重复循环约20次之后,我获得了一致的"启用"打印,并且我的用户空间应用程序很乐意使用它.

所以现在我的问题是:如何让我的代码在系统上的所有逻辑CPU上执行,以便为所有这些CPU启用兼容模式?

Tsy*_*rev 5

用于每个CPU使用on_each_cpu功能的执行代码.

签名:

int on_each_cpu(void (*func) (void *info), void *info, int wait)
Run Code Online (Sandbox Code Playgroud)

描述:

在所有处理器上调用函数.

如果wait参数非零,则等待所有CPU上的函数完成.

函数func不应该休眠,但整个on_each_cpu()调用不应该在原子上下文中完成.