在Linux上,为什么字符串文字的内存地址与其他文件的内存地址如此不同?

Noi*_*dea 62 c linux memory string-literals memory-address

我注意到字符串文字在内存中的地址与其他常量和变量(Linux OS)的地址非常不同:它们有许多前导零(不打印).

例:

const char *h = "Hi";
int i = 1;
printf ("%p\n", (void *) h);
printf ("%p\n", (void *) &i);
Run Code Online (Sandbox Code Playgroud)

输出:

0x400634
0x7fffc1ef1a4c
Run Code Online (Sandbox Code Playgroud)

我知道它们存储在.rodata可执行文件的一部分中.操作系统之后是否有一种特殊的方式处理它,所以文字最终会出现在一个特殊的内存区域(带有前导零)?这个内存位置有什么优点还是有什么特别之处呢?

PSk*_*cik 73

以下是Linux上的进程内存布局(来自http://www.thegeekstuff.com/2012/03/linux-processes-memory-layout/):

Linux进程内存布局

.RODATA部分是一个写保护的第初始化的全局数据块.(ELF可执行文件指定的部分.data是可写的全局变量初始化为非零值的可写对应部分.初始化为零的可写全局变量转到.bss块.这里的全局变量我指的是全局变量和所有静态变量,无论位置如何.)

图片应该解释你的地址的数值.

如果你想进一步调查,那么在Linux上你可以检查描述正在运行的进程的内存布局的 / proc/$ pid/maps虚拟文件.你不会得到保留的(以点开头)ELF部分名称,但你可以通过查看其内存保护标志来猜测内存块来自哪个ELF部分.例如,跑步

$ cat /proc/self/maps #cat's memory map
Run Code Online (Sandbox Code Playgroud)

给我

00400000-0040b000 r-xp 00000000 fc:00 395465                             /bin/cat
0060a000-0060b000 r--p 0000a000 fc:00 395465                             /bin/cat
0060b000-0060d000 rw-p 0000b000 fc:00 395465                             /bin/cat
006e3000-00704000 rw-p 00000000 00:00 0                                  [heap]
3000000000-3000023000 r-xp 00000000 fc:00 3026487                        /lib/x86_64-linux-gnu/ld-2.19.so
3000222000-3000223000 r--p 00022000 fc:00 3026487                        /lib/x86_64-linux-gnu/ld-2.19.so
3000223000-3000224000 rw-p 00023000 fc:00 3026487                        /lib/x86_64-linux-gnu/ld-2.19.so
3000224000-3000225000 rw-p 00000000 00:00 0
3000400000-30005ba000 r-xp 00000000 fc:00 3026488                        /lib/x86_64-linux-gnu/libc-2.19.so
30005ba000-30007ba000 ---p 001ba000 fc:00 3026488                        /lib/x86_64-linux-gnu/libc-2.19.so
30007ba000-30007be000 r--p 001ba000 fc:00 3026488                        /lib/x86_64-linux-gnu/libc-2.19.so
30007be000-30007c0000 rw-p 001be000 fc:00 3026488                        /lib/x86_64-linux-gnu/libc-2.19.so
30007c0000-30007c5000 rw-p 00000000 00:00 0
7f49eda93000-7f49edd79000 r--p 00000000 fc:00 2104890                    /usr/lib/locale/locale-archive
7f49edd79000-7f49edd7c000 rw-p 00000000 00:00 0
7f49edda7000-7f49edda9000 rw-p 00000000 00:00 0
7ffdae393000-7ffdae3b5000 rw-p 00000000 00:00 0                          [stack]
7ffdae3e6000-7ffdae3e8000 r--p 00000000 00:00 0                          [vvar]
7ffdae3e8000-7ffdae3ea000 r-xp 00000000 00:00 0                          [vdso]
ffffffffff600000-ffffffffff601000 r-xp 00000000 00:00 0                  [vsyscall]
Run Code Online (Sandbox Code Playgroud)

第一个r-xp块肯定来自.text(可执行代码),r--p来自.rodata的第一个块,以及来自.bss.data的以下rw--块.(在堆和堆栈块之间是动态链接器从动态链接库加载的块.)


注意:要符合标准,您应该转换int*"%p"to (void*)或者行为是未定义的.

  • @Noidea不同的进程有不同的地址空间.一个进程中的0xDEADBEEF(通常)与另一个进程中的0xDEADBEEF完全无关.与调试和块增长相关的上述布局有一些明显的小优点(特别是对于堆块,尽管如果它不能再长大,使用mmap对堆进行分段并不是什么大问题).此外,出于安全原因,实际映射的地址通常会有些随机. (7认同)
  • @Noidea:不要将物理地址(对应于RAM中的地址)与虚拟内存地址(进程中的地址)混淆.[内存管理单元](https://en.wikipedia.org/wiki/Memory_management_unit)的工作是将虚拟转换为物理,并且进程使用的所有地址都通过MMU进行转换.每个进程都有自己的MMU表,由操作系统管理. (6认同)

Arm*_*yan 15

那是因为字符串文字具有静态存储持续时间.也就是说,他们将在整个计划期间生活.这些变量可以存储在特殊的存储单元中,该存储单元既不在所谓的堆也不在堆栈中.因此地址不同.


Ste*_*mit 7

请记住,这里指向就是从那里指向不同的指向.一个更现实的(苹果对苹果)比较

printf ("%p\n", (void *) &h);
printf ("%p\n", (void *) &i);
Run Code Online (Sandbox Code Playgroud)

我怀疑你会发现hp有类似的地址.或者,另一个更现实的比较

static int si = 123;
int *ip = &si;
printf ("%p\n", (void *) h);
printf ("%p\n", (void *) ip);
Run Code Online (Sandbox Code Playgroud)

我怀疑你会发现hip指向一个类似的记忆区域.

  • 不,`h`已经是指向char的指针,所以`&h`没有任何用处.写`h`和`&i`是正确的,因为它们分别是引用字符串和`int`的地址. (3认同)
  • @SteveSummit指向字符串文字的指针将是另一个堆栈变量.但我想知道为什么字符串文字的地址与堆栈变量的地址有很大不同.不是为什么两个堆栈变量的地址相似;) (3认同)