nee*_*eru 3 c linux process linux-kernel unions
在阅读"理解Linux内核"时,我发现union正被用于Process Descriptor数据结构.
union thread_union {
struct thread_info thread_info;
unsigned long stack[2048]; /* 1024 for 4KB stacks */
};
Run Code Online (Sandbox Code Playgroud)
union thread_union
当两个数据结构都被使用时,为什么在这里使用union来联合?
首先,它是
union thread_union {
struct thread_info thread_info;
unsigned long stack[THREAD_SIZE/sizeof(long)];
};
Run Code Online (Sandbox Code Playgroud)
如内核中所定义include/linux/sched.h
).这很重要,因为宏THREAD_SIZE
在很多地方使用(在内核源中总共使用了几百次),并且在不同的体系结构之间有所不同.
OP想知道为什么不使用结构:
struct thread_struct {
struct thread_info thread_info;
unsigned long stack[(THREAD_SIZE - sizeof (struct thread_info))/sizeof (long)];
};
Run Code Online (Sandbox Code Playgroud)
(我假设相关的宏,init_thread_info
并且相应地init_stack
进行调整,即两者都指向开头init_thread_union
,因此实际的内存布局不会改变.)
简单的原因是联合的两个成员意图驻留在同一个内存区域,因此联合更合适.
完整的推理更复杂.重点是所有体系结构都定义了init_thread_union
此联合类型的变量init/init_task.c
,用于启动时的初始内核线程和预处理器宏
#define init_thread_info (init_thread_union.thread_info)
#define init_stack (init_thread_union.stack)
Run Code Online (Sandbox Code Playgroud)
在特定于体系结构的头文件中(例如,在arch/x86/include/asm/thread_info.h
x86上).这些宏分别指向初始线程(启动内核的线程)及其堆栈.
据我所知,union thread_union
除了初始堆栈和线程信息之外,该类型不用于任何其他目的.此外,该init_thread_info
部件仅在启动期间需要,而不是在以后启动.
这意味着如果使用结构而不是联合,则struct thread_info
只要内核正在运行,该部分就会在内存中保持未使用状态.当然,它不是很多字节..但是,使用一个联合 - 记住在Linux中,堆栈增长 - 初始线程信息位于初始堆栈区域的末尾,如果在某些时候有一个深度内核代码中的足够的调用链需要每一位可用的内核堆栈,初始的thread_info将被堆栈数据覆盖.哪个好,因为不再需要了.
(如果你非常敏锐,你会发现使用这个结构具有相同的实际效果:耗尽init_stack
会溢出到init_thread_info
成员中,覆盖它.假设,正如我在括号中所指出的那样,宏被调整到点如果未调整宏,则初始线程信息将保留在内存中,未使用,直到重新启动或关闭.)
总而言之,union更合适,因为内核开发人员专门为初始线程信息和初始堆栈(用于启动内核的线程)使用union类型,并且明显希望它们占用相同的内存区域.尽管使用结构可以实现完全相同的实际效果,但它会使得init_thread_info
和init_stack
宏不必要地复杂化,浪费其他/未来开发人员尝试破译原始意图的时间.
最后,请记住,内核开发人员对实际结果比对理论或标准更感兴趣.例如,C编译器编写者可以指出,根据C标准,访问联合的不同成员而不是最后一次赋值给union,会产生未定义的结果.这没关系:内核依赖于实际的,现实世界的行为,而不是任何标准的文本.这也意味着阅读LKML或与内核相关的其他邮件列表的代码,注释和讨论总是比依赖一般的C知识更具指导性和可靠性.