为什么objdump的汇编编码不同？

Question

为什么objdump的汇编编码不同？

shp*_*ark 2 x86 assembly gcc objdump intel-syntax

我正在阅读有关位置独立代码的文章，并且遇到了此函数的汇编清单。

0000043c <ml_func>:
 43c:   55                      push   ebp
 43d:   89 e5                   mov    ebp,esp
 43f:   e8 16 00 00 00          call   45a <__i686.get_pc_thunk.cx>
 444:   81 c1 b0 1b 00 00       add    ecx,0x1bb0
 44a:   8b 81 f0 ff ff ff       mov    eax,DWORD PTR [ecx-0x10]
 450:   8b 00                   mov    eax,DWORD PTR [eax]
 452:   03 45 08                add    eax,DWORD PTR [ebp+0x8]
 455:   03 45 0c                add    eax,DWORD PTR [ebp+0xc]
 458:   5d                      pop    ebp
 459:   c3                      ret

0000045a <__i686.get_pc_thunk.cx>:
 45a:   8b 0c 24                mov    ecx,DWORD PTR [esp]
 45d:   c3                      ret

Run Code Online (Sandbox Code Playgroud)

但是，在我的机器（gcc-7.3.0，Ubuntu 18.04 x86_64）上，下面得到的结果略有不同：

0000044d <ml_func>:
 44d:   55                      push   %ebp
 44e:   89 e5                   mov    %esp,%ebp
 450:   e8 29 00 00 00          call   47e <__x86.get_pc_thunk.ax>
 455:   05 ab 1b 00 00          add    $0x1bab,%eax
 45a:   8b 90 f0 ff ff ff       mov    -0x10(%eax),%edx
 460:   8b 0a                   mov    (%edx),%ecx
 462:   8b 55 08                mov    0x8(%ebp),%edx
 465:   01 d1                   add    %edx,%ecx
 467:   8b 90 f0 ff ff ff       mov    -0x10(%eax),%edx
 46d:   89 0a                   mov    %ecx,(%edx)
 46f:   8b 80 f0 ff ff ff       mov    -0x10(%eax),%eax
 475:   8b 10                   mov    (%eax),%edx
 477:   8b 45 0c                mov    0xc(%ebp),%eax
 47a:   01 d0                   add    %edx,%eax
 47c:   5d                      pop    %ebp
 47d:   c3                      ret

Run Code Online (Sandbox Code Playgroud)

我发现的主要区别是mov指令的语义。在上上市，mov ebp,esp实际上移动esp到ebp，而在较低的上市，mov %esp,%ebp做同样的事情，但操作数的顺序是不同的。

即使我必须编写手写汇编代码，这也很令人困惑。总而言之，我的问题是（1）为什么对于相同的指令我得到了不同的汇编表示形式；以及（2）在编写汇编代码（例如使用__asm(:::);）时应该使用哪一个？

Answer 1

Pet*_*des 5

obdjump默认为-MattAT＆T语法（例如您的第二个代码块）。请参阅att与intel语法。标签Wiki包含一些有关语法差异的信息：https : //stackoverflow.com/tags/att/info与https://stackoverflow.com/tags/intel-syntax/info

两种语法都有相同的限制，这取决于机器本身可以做什么以及机器代码中可编码的内容。它们只是文本表达方式的不同。

使用objdump -d -Mintel英特尔的语法。我alias disas='objdump -drwC -Mintel'在自己的中使用.bashrc，因此我可以disas foo.o并得到我想要的格式，其中打印了重定位（对于使非链接有意义）很重要.o，没有用于长指令的换行，并且C ++符号名称已分解。

在内联汇编中，可以使用任何一种语法，只要它与编译器期望的语法匹配即可。默认为AT＆T，这是我推荐用于与clang兼容的内容。也许有办法，但是clang与GCC的工作方式不同-masm=intel。

此外，AT＆T基本上是x86上GNU C内联汇编的标准，这意味着您不需要特殊的构建选项即可运行代码。

但是您可以gcc -masm=intel用来编译在asm语句中使用Intel语法的源文件。如果您不关心clang，则可以自己使用。

如果您要为标头编写代码，则至少可以在GCC中使用方言替代方法使其在AT＆T和Intel语法之间可移植：

static inline
void atomic_inc(volatile int *p) {
    // use __asm__ instead of asm in headers, so it works even with -std=c11 instead of gnu11
    __asm__("lock {addl $1, %0 | add %0, 1}": "+m"(*p));
// TODO: flag output for return value?
   // maybe doesn't need to be asm volatile; compilers know that modifying pointed-to memory is a visible side-effect unless it's a local that fully optimizes away.
   // If you want this to work as a memory barrier, use a `"memory"` clobber to stop compile-time memory reordering.  The lock prefix provides a runtime full barrier
}

Run Code Online (Sandbox Code Playgroud)

Godbolt编译器资源管理器上 gcc / clang的source + asm输出。

使用g++ -O3（默认或-masm=att），我们得到

atomic_inc(int volatile*):
    lock addl $1, (%rdi)              # operand-size is from my explicit addl suffix
    ret

Run Code Online (Sandbox Code Playgroud)

有了g++ -O3 -masm=intel，我们得到

atomic_inc(int volatile*):
    lock  add DWORD PTR [rdi], 1      # operand-size came from the %0 expansion
    ret

Run Code Online (Sandbox Code Playgroud)

clang适用于AT＆T版本，但无法使用-masm=intel（或-mllvm --x86-asm-syntax=intel暗示），因为它显然仅适用于LLVM发出的代码，而不适用于前端如何填充asm模板。

铛错误消息是：

<source>:4:13: error: unknown use of instruction mnemonic without a size suffix
    __asm__("lock {addl $1, %0 | add %0, 1}": "+m"(*p));
            ^
<inline asm>:1:2: note: instantiated into assembly here
        lock  add (%rdi), 1
        ^
1 error generated.

Run Code Online (Sandbox Code Playgroud)

它选择了“ Intel”语法替代方案，但仍使用AT＆T内存操作数填充模板。

归档时间：	7 年，3 月前
查看次数：	55 次
最近记录：	7 年，3 月前