shp*_*ark 2 x86 assembly gcc objdump intel-syntax
我正在阅读有关位置独立代码的文章,并且遇到了此函数的汇编清单。
0000043c <ml_func>:
43c: 55 push ebp
43d: 89 e5 mov ebp,esp
43f: e8 16 00 00 00 call 45a <__i686.get_pc_thunk.cx>
444: 81 c1 b0 1b 00 00 add ecx,0x1bb0
44a: 8b 81 f0 ff ff ff mov eax,DWORD PTR [ecx-0x10]
450: 8b 00 mov eax,DWORD PTR [eax]
452: 03 45 08 add eax,DWORD PTR [ebp+0x8]
455: 03 45 0c add eax,DWORD PTR [ebp+0xc]
458: 5d pop ebp
459: c3 ret
0000045a <__i686.get_pc_thunk.cx>:
45a: 8b 0c 24 mov ecx,DWORD PTR [esp]
45d: c3 ret
Run Code Online (Sandbox Code Playgroud)
但是,在我的机器(gcc-7.3.0,Ubuntu 18.04 x86_64)上,下面得到的结果略有不同:
0000044d <ml_func>:
44d: 55 push %ebp
44e: 89 e5 mov %esp,%ebp
450: e8 29 00 00 00 call 47e <__x86.get_pc_thunk.ax>
455: 05 ab 1b 00 00 add $0x1bab,%eax
45a: 8b 90 f0 ff ff ff mov -0x10(%eax),%edx
460: 8b 0a mov (%edx),%ecx
462: 8b 55 08 mov 0x8(%ebp),%edx
465: 01 d1 add %edx,%ecx
467: 8b 90 f0 ff ff ff mov -0x10(%eax),%edx
46d: 89 0a mov %ecx,(%edx)
46f: 8b 80 f0 ff ff ff mov -0x10(%eax),%eax
475: 8b 10 mov (%eax),%edx
477: 8b 45 0c mov 0xc(%ebp),%eax
47a: 01 d0 add %edx,%eax
47c: 5d pop %ebp
47d: c3 ret
Run Code Online (Sandbox Code Playgroud)
我发现的主要区别是mov指令的语义。在上上市,mov ebp,esp实际上移动esp到ebp,而在较低的上市,mov %esp,%ebp做同样的事情,但操作数的顺序是不同的。
即使我必须编写手写汇编代码,这也很令人困惑。总而言之,我的问题是(1)为什么对于相同的指令我得到了不同的汇编表示形式;以及(2)在编写汇编代码(例如使用__asm(:::);)时应该使用哪一个?
obdjump默认为-MattAT&T语法(例如您的第二个代码块)。请参阅att与intel语法。标签Wiki包含一些有关语法差异的信息:https : //stackoverflow.com/tags/att/info与https://stackoverflow.com/tags/intel-syntax/info
两种语法都有相同的限制,这取决于机器本身可以做什么以及机器代码中可编码的内容。它们只是文本表达方式的不同。
使用objdump -d -Mintel英特尔的语法。我alias disas='objdump -drwC -Mintel'在自己的中使用.bashrc,因此我可以disas foo.o并得到我想要的格式,其中打印了重定位(对于使非链接有意义)很重要.o,没有用于长指令的换行,并且C ++符号名称已分解。
在内联汇编中,可以使用任何一种语法,只要它与编译器期望的语法匹配即可。默认为AT&T,这是我推荐用于与clang兼容的内容。也许有办法,但是clang与GCC的工作方式不同-masm=intel。
此外,AT&T基本上是x86上GNU C内联汇编的标准,这意味着您不需要特殊的构建选项即可运行代码。
但是您可以gcc -masm=intel用来编译在asm语句中使用Intel语法的源文件。如果您不关心clang,则可以自己使用。
如果您要为标头编写代码,则至少可以在GCC中使用方言替代方法使其在AT&T和Intel语法之间可移植:
static inline
void atomic_inc(volatile int *p) {
// use __asm__ instead of asm in headers, so it works even with -std=c11 instead of gnu11
__asm__("lock {addl $1, %0 | add %0, 1}": "+m"(*p));
// TODO: flag output for return value?
// maybe doesn't need to be asm volatile; compilers know that modifying pointed-to memory is a visible side-effect unless it's a local that fully optimizes away.
// If you want this to work as a memory barrier, use a `"memory"` clobber to stop compile-time memory reordering. The lock prefix provides a runtime full barrier
}
Run Code Online (Sandbox Code Playgroud)
Godbolt编译器资源管理器上 gcc / clang的source + asm输出。
使用g++ -O3(默认或-masm=att),我们得到
atomic_inc(int volatile*):
lock addl $1, (%rdi) # operand-size is from my explicit addl suffix
ret
Run Code Online (Sandbox Code Playgroud)
有了g++ -O3 -masm=intel,我们得到
atomic_inc(int volatile*):
lock add DWORD PTR [rdi], 1 # operand-size came from the %0 expansion
ret
Run Code Online (Sandbox Code Playgroud)
clang适用于AT&T版本,但无法使用-masm=intel(或-mllvm --x86-asm-syntax=intel暗示),因为它显然仅适用于LLVM发出的代码,而不适用于前端如何填充asm模板。
铛错误消息是:
<source>:4:13: error: unknown use of instruction mnemonic without a size suffix
__asm__("lock {addl $1, %0 | add %0, 1}": "+m"(*p));
^
<inline asm>:1:2: note: instantiated into assembly here
lock add (%rdi), 1
^
1 error generated.
Run Code Online (Sandbox Code Playgroud)
它选择了“ Intel”语法替代方案,但仍使用AT&T内存操作数填充模板。