为什么我的数据部分在编译后的二进制文件中出现两次?Ubuntu、x86、nasm、gdb、reaelf

Bri*_*ian 4 x86 assembly gdb nasm shellcode

回答了之前的相关问题。谢谢!然而,这给我带来了一个新问题。为什么 nasm 将数据字节放在两个不同的内存位置?我在下面包含了程序信息和其他数据转储。

---------- code snippet compiled with nasm, ld -----------------
section .text
...
zero: jmp short two
one:  pop ebx
      xor eax, eax
      mov [ebx+12], eax
      mov [ebx+8], ebx
      mov [ebx+7], al
      lea ecx, [ebx+8]
      lea edx, [ebx+12]
      mov al, 11
      int 0x80
two:  call one
section .data align=1
msg:   db '/bin/sh0argvenvp' 

-------- readelf output to show load locations --------
readelf -Wl myshdb

Elf file type is EXEC (Executable file)
Entry point 0x8048080
There are 2 program headers, starting at offset 52

Program Headers:
  Type           Offset   VirtAddr   PhysAddr   FileSiz MemSiz  Flg Align
  LOAD           0x000000 0x08048000 0x08048000 0x0009d 0x0009d R E 0x1000
  LOAD           0x00009d 0x0804909d 0x0804909d 0x00010 0x00010 RW  0x1000

 Section to Segment mapping:
  Segment Sections...
   00     .text 
   01     .data 

-------------- run with gdb and debug step to mov instructions ----------
---------------registers--------------
EAX: 0x0 
EBX: 0x804809d ("/bin/sh0argvenvp")

----------- memory address checks ------------
gdb-peda$ p zero
$15 = {<text variable, no debug info>} 0x8048080 <zero>
gdb-peda$ p one
$16 = {<text variable, no debug info>} 0x8048082 <one>
gdb-peda$ p two
$17 = {<text variable, no debug info>} 0x8048098 <two>
gdb-peda$ p $ebx
$18 = 0x804809d
gdb-peda$ p msg
$19 = 0x6e69622f
gdb-peda$ x 0x804809d
0x804809d:  "/bin/sh0argvenvp"
gdb-peda$ x msg
0x6e69622f: <error: Cannot access memory at address 0x6e69622f>
Run Code Online (Sandbox Code Playgroud)

换句话说,字符串消息可直接从代码 (0x804809d) 之后的内存位置获得。然而 msg 标签映射到 0x6e69622f,这是我数据的标签。如何使用gdb查看第二个地址的数据?nasm 是否将数据放在两个不同的位置?为什么?

Emp*_*ian 9

我们来看看LOAD细分:

Type Offset VirtAddr PhysAddr FileSiz MemSiz Flg Align
LOAD 0x000000 0x08048000 0x08048000 0x0009d 0x0009d R E 0x1000
LOAD 0x00009d 0x0804909d 0x0804909d 0x00010 0x00010 RW 0x1000

第一个指示加载器将mmap 0x9d字节从文件偏移量0到地址为虚拟内存0x08048000

装载机无法做到准确,因为内存映射只能在一个页面(4096个字节)的粒度。所以它mmap.text,以及文件中跟在它后面的所有内容,最多一页,地址为0x08048000

这意味着无论.data遵循.text该文件中抵销后0x9d会出现在地址0x0804809d及更高版本,但错误的权限(READ和Execute)。

第二个LOAD段指示加载程序mmap文件内容,从0x9d虚拟地址处的偏移量开始0x0804909d

由于相同的“页面粒度”原因,加载程序也不能完全做到这一点。

相反,它将向下舍入偏移量和地址,以及mmap0地址处的偏移量开始的文件内容0x08049000

这意味着文件中.text前面.data的任何内容都将出现在 address before 0x0804909d,再次具有错误的权限(这次是Read 和Write )。

您可以确认那正是利用GDB发生x/10i 0x8049080-你会看到确切相同的指令与x/10i 0x8048080

您还可以观察mmap加载程序执行的实际系统调用strace