Luc*_*cas 3 assembly x86-64 nasm machine-code
我很好奇如果我把db 0x41
这个.text
部分放在它通常所属的地方,而不是放在.data
它通常所属的地方,会发生什么。它会出现段错误,但到底为什么呢?
下面的代码是在 Mint 19.1 中使用 和 进行编译、链接和执行nasm
的ld
。
无段错误:
global _start
section .data
db 0x41
section .text
_start:
mov rax, 60 ; Exit(0) syscall
xor rdi, rdi
syscall
Run Code Online (Sandbox Code Playgroud)
段错误:
global _start
section .text
_start:
db 0x41
mov rax, 60 ; Exit(0) syscall
xor rdi, rdi
syscall
Run Code Online (Sandbox Code Playgroud)
我使用以下命令来组装、链接和运行它:
global _start
section .data
db 0x41
section .text
_start:
mov rax, 60 ; Exit(0) syscall
xor rdi, rdi
syscall
Run Code Online (Sandbox Code Playgroud)
如果您告诉汇编器在某处汇编任意字节,它就会这样做。 db
是一个发出字节的伪指令,因此mov eax, 60
和db 0xb8, 0x3c, 0, 0, 0
就 NASM 而言完全相同。任一者都会将这 5 个字节发送到当前位置的输出中。
如果您不希望数据被解码为指令(的一部分),请不要将其放在执行将到达的位置。 (例如,将其放在代码中section .rodata
或之前或之后,就像问题中一样。如果您希望 asm 源在使用某些数据的每个函数附近定义静态/全局数据,则section .data
可以在其他部分之间来回切换。)section .text
由于您使用的是 NASM 1,它会优化mov rax,60
为mov eax,60
,因此该指令没有您期望从源中获得的 REX 前缀。
您手动编码的 REX 前缀将mov
其更改为mov
R8D 而不是 EAX:
41 b8 3c 00 00 00 mov r8d,0x3c
(我检查了objdump -drwC -Mintel
而不是查找 REX 前缀中的哪个位。我只记得 REX.W 是0x48
。但是0x41
在 x86-64 中是 REX.B 前缀)。
因此,您的代码不会进行sys_exit
系统调用,而是以 EAX=0运行syscall
,即__NR_read
. (Linux 内核在进程启动之前将除 RSP 之外的所有寄存器清零,并且在静态链接的可执行文件中,这_start
是真正的入口点,没有首先运行动态链接器代码。因此 RAX 仍然为零)。
$ strace ./rex
execve("./rex", ["./rex"], 0x7fffbbadad60 /* 54 vars */) = 0
read(0, NULL, 0) = 0
--- SIGSEGV {si_signo=SIGSEGV, si_code=SEGV_MAPERR, si_addr=NULL} ---
+++ killed by SIGSEGV (core dumped) +++
Run Code Online (Sandbox Code Playgroud)
然后执行会进入后面 syscall
的内容,在本例中是00 00
解码为 的字节add [rax], al
,因此会出现段错误。 如果您在 GDB 中运行代码,您就会看到这一点。
脚注 1:如果您使用的 YASM 未针对 32 位操作数大小进行优化:
Intel 的手册称,一条指令上有 2 个 REX 前缀是非法的。我预计会出现非法指令错误(#UD 机器异常 -> 内核发出 SIGILL),但我的 Skylake CPU 忽略第一个 REX 前缀并将其解码为mov rax, sign_extended_imm32
.
单步执行,它被视为一个长指令,所以我猜 Skylake 选择像其他多个前缀的情况一样处理它,其中只有最后一个类型有效。(但请记住,这并不是面向未来的,其他 x86 CPU 可能会以不同的方式处理它。)
其他情况下的相关/相同错误:
归档时间: |
|
查看次数: |
862 次 |
最近记录: |