如何在Linux内核中实现percpu指针?

dsp*_*pjm 15 linux smp linux-kernel

在多处理器上,每个核心都可以拥有自己的变量.我认为它们在不同的地址中是不同的变量,尽管它们在同一个过程中并且具有相同的名称.

但我想知道,内核如何实现这一点?它是否会分配一块内存来存放所有percpu指针,并且每次将指针重定向到某个地址时会有移位或什么?

ugo*_*ren 23

正常的全局变量不是每个CPU.自动变量在堆栈上,不同的CPU使用不同的堆栈,因此它们自然会获得单独的变量.

我猜你是指Linux的每CPU变量基础设施.
大多数魔法在这里(asm-generic/percpu.h):

extern unsigned long __per_cpu_offset[NR_CPUS];

#define per_cpu_offset(x) (__per_cpu_offset[x])

/* Separate out the type, so (int[3], foo) works. */
#define DEFINE_PER_CPU(type, name) \
    __attribute__((__section__(".data.percpu"))) __typeof__(type) per_cpu__##name

/* var is in discarded region: offset to particular copy we want */
#define per_cpu(var, cpu) (*RELOC_HIDE(&per_cpu__##var, __per_cpu_offset[cpu]))
#define __get_cpu_var(var) per_cpu(var, smp_processor_id())
Run Code Online (Sandbox Code Playgroud)

RELOC_HIDE(ptr, offset)只是ptr按字节的给定偏移量前进(不管指针类型如何).

它有什么作用?

  1. 定义时DEFINE_PER_CPU(int, x),__per_cpu_x在特殊.data.percpu部分中创建一个整数.
  2. 加载内核时,此部分会多次加载 - 每个CPU加载一次(这部分魔法不在上面的代码中).
  3. __per_cpu_offset阵列填充有副本之间的距离.假设使用1000个字节的每个cpu数据,__per_cpu_offset[n]将包含1000*n.
  4. per_cpu__x在加载期间,符号将重新定位到CPU 0 per_cpu__x.
  5. __get_cpu_var(x),当在CPU 3上运行时,将转换为*RELOC_HIDE(&per_cpu__x, __per_cpu_offset[3]).这从CPU 0开始,x在CPU 0的数据和CPU 3之间添加偏移量,并最终取消引用结果指针.

  • 我一直在研究代码.这个答案写完后,看起来情况有所改变.`DEFINE_PER_CPU(int,x)`定义了一个名为`x`的符号,而不是`per_cpu__x`.在加载内核时,不是将`x`重定位到CPU 0的副本,`__per_cpu_offset [0]`保存链接器分配给`x`的地址与实际存储CPU 0的副本的地址之间的差异.另外:x86内核不是一直访问`__per_cpu_offset`,而是将该偏移存储为段`fs`的基础.然后取消引用段`fs`中的指针直接进入当前CPU的副本! (2认同)