GCC 内联 - 将地址推送到堆栈,而不是其值

use*_*520 3 c gcc inline-assembly att

我正在尝试GCC的内联汇编器(我使用MinGW,我的操作系统是Win7)。现在我只能使用一些基本的 C stdlib 函数。我通常熟悉 Intel 语法,但对 AT&T 不太熟悉。

下面的代码效果很好:

char localmsg[] = "my local message";
asm("leal %0, %%eax" : "=m" (localmsg));
asm("push %eax");
asm("call %0" : : "m" (puts));
asm("add $4,%esp");
Run Code Online (Sandbox Code Playgroud)

然而,这个 LEA 似乎是多余的,因为我可以直接将值推入堆栈。好吧,由于我认为 AT&T 的特性,请执行以下操作:

asm("push %0" : "=m" (localmsg));
Run Code Online (Sandbox Code Playgroud)

将在最终的可执行文件中生成以下汇编代码:

PUSH DWORD PTR SS:[ESP+1F]
Run Code Online (Sandbox Code Playgroud)

因此,不是将地址推送到我的字符串,而是推送其内容,因为用 C 术语来说,“指针”被“取消引用”。这显然会导致崩溃。

我相信这只是 GAS 的正常行为,但我无法找到任何有关如何克服此问题的信息。我将不胜感激任何帮助。

PS我知道对于有经验的人来说这是一个微不足道的问题。我预计会被否决,但我刚刚花了 45 分钟寻找解决方案,但一无所获。

PPS 我意识到执行此操作的正确方法是调用puts( )C 代码。这纯粹是出于教育/实验原因。

Dav*_*erd 5

虽然内联汇编总是有点棘手,但从中调用函数尤其具有挑战性。我不建议“了解内联汇编”项目。如果您还没有,我建议您查看最新的内联 asm文档。为了解释内联汇编如何工作,已经做了很多工作。

也就是说,这里有一些想法:

1)像这样使用多个asm语句是一个坏主意。正如文档所说:不要期望一系列 asm 语句在编译后保持完全连续。如果某些指令需要在输出中保持连续,请将它们放在单个多指令 asm 语句中。

2)直接修改寄存器(就像你对eax所做的那样)而不让gcc知道你正在这样做也是一个坏主意。您应该使用寄存器约束(以便 gcc 可以选择自己的寄存器)或 clobber 让 gcc 知道您正在踩踏它们。

3) 当调用函数(如puts)时,虽然有些寄存器必须在返回之前恢复其值,但有些寄存器可以被调用函数视为暂存寄存器(即在返回之前修改且不恢复)。正如我在 #2 中提到的,让你的 asm 修改寄存器而不通知 gcc 是一个非常糟糕的主意。如果您知道所调用函数的 ABI,则可以将其临时寄存器添加到 asm 的破坏列表中。

4) 虽然在这个具体示例中您使用的是常量字符串,但作为一般规则,当将 asm 指针传递给字符串、结构、数组等时,您可能需要“内存”破坏器来确保任何挂起的写入内存在开始执行你的 asm 之前执行。

5) 事实上,他们lea正在做一些非常重要的事情。esp 的值在编译时是未知的,所以它不像你可以执行的那样push $12345。在将其压入堆栈之前,需要有人计算(esp + localmsg 的偏移量)。另请参阅下面的第二个示例。

6) 如果您更喜欢 intel 格式(哪个思维正常的人会不喜欢?),您可以使用 -masm=intel。

鉴于这一切,我对这段代码的第一次切割如下所示。请注意,这不会破坏 put 的暂存寄存器。剩下的就是作为练习了...

#include <stdio.h>

int main()
{
  const char localmsg[] = "my local message";

  int result;

  /* Use 'volatile' since 'result' is usually not going to get used,
     which might tempt gcc to discard this asm statement as unneeded. */

  asm volatile ("push %[msg] \n\t"   /* Push the address of the string. */
                "call %[puts] \n \t" /* Call the print function. */
                "add $4,%%esp"       /* Clean up the stack. */

                : "=a" (result) /* The result code from puts. */
                : [puts] "m" (puts), [msg] "r" (localmsg)
                : "memory", "esp");

   printf("%d\n", result);
}
Run Code Online (Sandbox Code Playgroud)

确实,这并不能避免lea#5 的原因。但是,如果这真的重要,请尝试以下操作:

#include <stdio.h>
const char localmsg[] = "my local message";

int main()
{

  int result;

  /* Use 'volatile' since 'result' is usually not going to get used. */

  asm volatile ("push %[msg] \n\t" /* Push the address of the string. */
                "call %[puts] \n \t" /* Call the print function. */
                "add $4,%%esp"       /* Clean up the stack. */

                : "=a" (result) /* The result code. */
                : [puts] "m" (puts), [msg] "i" (localmsg)
                : "memory", "esp");

   printf("%d\n", result);
}
Run Code Online (Sandbox Code Playgroud)

作为全局变量,localmsg 的地址现在在编译时是已知的(好吧,我简化了一点),生成的 asm 如下所示:

push $__ZL8localmsg
call _puts
add $4,%esp
Run Code Online (Sandbox Code Playgroud)

多田。