汇编 Linux 系统调用与汇编 OS x 系统调用

Nic*_*k M 4 linux macos x86 assembly 32-bit

我在 Mac 上运行汇编代码时遇到问题。我目前正在阅读 Jeff Duntemann 的书 Assembly Step by Step。问题在于它专注于为 32 位 linux 系统编写程序集。我使用的是 64 位 mac os x 系统。我仍然可以使用 nasm -f macho32 在我的 64 位系统上运行 32 位程序集,但显然 Duntemann 书中的代码不起作用,因为 Linux 和 mac os x 中的系统调用不同。我将如何转换这个程序:

;  Executable name : EATSYSCALL
;  Version         : 1.0
;  Created date    : 1/7/2009
;  Last update     : 2/18/2009
;  Author          : Jeff Duntemann
;  Description     : A simple program in assembly for Linux, using NASM 2.05,
;    demonstrating the use of Linux INT 80H syscalls to display text.
;
;  Build using these commands:
;    nasm -f elf -g -F stabs eatsyscall.asm
;    ld -o eatsyscall eatsyscall.o
;

 SECTION .data          ; Section containing initialised data

     EatMsg: db "Eat at Joe's!",10
     EatLen: equ $-EatMsg   

 SECTION .bss           ; Section containing uninitialized data 

 SECTION .text          ; Section containing code

 global     _start          ; Linker needs this to find the entry point!

_start:
     nop            ; This no-op keeps gdb happy...
     mov eax,4      ; Specify sys_write call
     mov ebx,1      ; Specify File Descriptor 1: Standard Output
     mov ecx,EatMsg     ; Pass offset of the message
     mov edx,EatLen     ; Pass the length of the message
     int 80H            ; Make kernel call

     mov eax,1      ; Code for Exit Syscall
     mov ebx,0      ; Return a code of zero 
     int 80H            ; Make kernel call
Run Code Online (Sandbox Code Playgroud)

以便它可以在我的 mac os x 系统上运行?我更喜欢 32 位程序集的解决方案,因为我正在尝试学习它,而不是更复杂的 64 位程序集。

我在网上找到了一个解决方案,但它使用堆栈并有其他差异,例如从 esp 寄存器中减去,即使 Duntemann 的程序根本没有引用 esp 寄存器:

global start

 section .text
 start:
    push    dword msg.len
       push    dword msg
    push    dword 1
    mov     eax, 4
    sub     esp, 4
    int     0x80
    add     esp, 16

    push    dword 0
    mov     eax, 1
    sub     esp, 12
    int     0x80

 section .data

 msg:    db      "Hello, world!", 10
.len:   equ     $ - msg
Run Code Online (Sandbox Code Playgroud)

所以我想我想知道的是如何将linux系统调用转换为mac os x系统调用的分步过程?这样,当我阅读本书时,我就可以做到这一点,而不必在虚拟机或其他东西上下载 linux。

Geo*_*ler 5

那个解决方案是错误的。该行sub esp, 12应该是sub esp, 4。它没有传递 0 作为退出状态;它正在传递一个垃圾值。

Mac OS X 有 BSD 系统调用。示例很难找到,因为大多数 BSD 程序不进行直接系统调用;它们链接到 libc 并调用 libc 中包装系统调用的函数。但是在汇编语言中,直接系统调用可能比 libc 调用更简单。

对于 32 位 Intel 代码,OS X 和 Linux 都响应int 0x80. 它们都将系统调用号输入到 中eax,并且都将结果返回到 中eax。主要区别如下:

  • Linux 接受寄存器 ( ebx, ecx, edx) 中的参数,但 OS X 接受堆栈中的参数。您以相反的顺序推送参数,然后再推送额外的 4 个字节。
  • 当发生错误时,Linux 在 中放入一个负数eax,而 OS X 在 中放入一个正数eax。OS X 还设置了一个条件代码,如果错误发生或没有发生,jb或者jnb会跳转。
  • 系统调用有不同的编号,有些有不同的参数。

重要文件:syscalls.master

BSD 系统使用名为 syscalls.master 的文件来定义系统调用。我已从 Mac OS X 10.4.11x86链接到syscalls.master。我们可以使用它来查找每个系统调用的名称、参数和返回类型。例如:

4   PRE     NONE    ALL { user_ssize_t write(int fd, user_addr_t cbuf, user_size_t nbyte); } 
Run Code Online (Sandbox Code Playgroud)

write(2) 系统调用的编号为 4,因此我们加载eax了 4。它有 3 个参数,因此我们以相反的顺序推送它们:我们推送缓冲区中的字节数,然后推送指向缓冲区的指针,然后推送文件描述符。推送参数后,我们推送 4 个额外的字节,可能带有sub esp, 4. 然后我们做int 0x80。然后我们可能想要add esp, 16删除我们推送的内容。

大多数参数和返回值是 4 字节整数,但off_t在 OS X 中始终是 8 字节整数。我们必须小心像 lseek(2) 这样的调用。

199 NONE    NONE    ALL { off_t lseek(int fd, off_t offset, int whence); } 
Run Code Online (Sandbox Code Playgroud)

offset 参数是一个 8 字节整数,因此我们将其作为一对 4 字节双字推送。Intel 处理器是小端的,堆栈向下增长,所以我们先推送高位双字,然后再推送低位双字。lseek(2) 的返回类型也是 off_t。它出现在寄存器eax和中edx,低字在eax,高字在edx

有些系统调用很奇怪。为了捕捉信号,与 Linux 不同,OS X 没有对 signal(3) 的系统调用。我们必须使用 sigaction(2),但这很奇怪:

46  NONE    KERN    ALL { int sigaction(int signum, struct __sigaction *nsa, struct sigaction *osa); } 
Run Code Online (Sandbox Code Playgroud)

第二个参数不是常规的 sigaction 结构。这是一个更大的结构,包括一个额外的蹦床字段。如果我们不在libc中调用sigaction(),那么我们必须提供我们自己的trampoline!它不同于 Linux 和其他 BSD 内核。