为什么本程序的32位和64位编译版本以这种方式填充内存?

she*_*ept 1 linux compiler-construction x86 stack x86-64

我想更好地了解堆栈和堆如何工作.在比较同一程序的32位和64位编译版本时,我遇到了麻烦.在这两种情况下,我都使用了一个来宾Fedora 15 VM(32和64),gcc用于编译,gdb用于调试,以及相同的主机硬件.有问题的程序非常简单,紧接着如下:

C程序

void function(int a, int b, int c, int d){
    int value;
    char buffer[10];

    value = 1234;
    buffer[0] = 'A';
}

int main(){
    function(1, 2, 3, 4);
}
Run Code Online (Sandbox Code Playgroud)

为了空间的利益,我省略了程序的汇编转储; 但是,如果有人认为这可能有助于他们回答我的问题,我很乐意将其纳入其中.

32位编译程序:

参数4(0xbffff3e4),3(0xbffff3e0),2(0xbffff3dc)和1(0xbffff3d8)首先被压入堆栈.接下来的指令的位置以下的呼叫为函数() -或返回地址-被放置在堆(0x080483d1)上.接下来,前一个堆栈(0xbffff3e8)的基指针的值被推送到堆栈.

(gdb) x/16xw $esp
0xbffff3c0: 0x00000000  0x410759c3  0x4105d237  0x00000000
0xbffff3d0: 0xbffff3e8  0x080483d1  0x00000001  0x00000002//pointers
0xbffff3e0: 0x00000003  0x00000004  0x00000000  0x4105d413//followed by params
0xbffff3f0: 0x00000001  0xbffff484  0xbffff48c  0x41040fc4
Run Code Online (Sandbox Code Playgroud)

64位编译程序:

然而; 这里没有看到值4,3,2和1.我只能看到,无论我看到的堆栈多远,都是返回地址(0x4004ae)和先前堆栈帧的基指针(0x7fffffffe210).

(gdb) x/16xg $rsp
0x7fffffffe200: 0x00007fffffffe210  0x00000000004004ae //pointers
0x7fffffffe210: 0x0000000000000000  0x00000036d042139d
0x7fffffffe220: 0x0000000000000000  0x00007fffffffe2f8
0x7fffffffe230: 0x0000000100000000  0x0000000000400491
0x7fffffffe240: 0x0000000000000000  0x7ade47f577d82f75
0x7fffffffe250: 0x0000000000400390  0x00007fffffffe2f0
0x7fffffffe260: 0x0000000000000000  0x0000000000000000
0x7fffffffe270: 0x8521b80ab3982f75  0x7ab3e77151682f75
Run Code Online (Sandbox Code Playgroud)

带有print语句的64位编译程序:

现在,添加一个简单的print语句后:

printf("%d, %c\n", flag, buffer[0]);
Run Code Online (Sandbox Code Playgroud)

在function()中,我可以看到任意参数(见下文,0x7fffffffe1e0-0x7fffffffe1ec).我还可以看到前一个堆栈帧的基本指针,0x7fffffffe210(在0x7fffffffe200中)和返回地址0x400520(在0x7fffffffe208中).我认为由于新的印刷声明而改变了. 在这种情况下,如果没有打印声明,为什么4,3,2和1不可见?gcc编译器的64位实现是否足够智能,不会"浪费"内存中的参数和从未使用的局部变量?

(gdb) x/16xg $rsp
0x7fffffffe1e0: 0x0000000300000004  0x0000000100000002 //parameters
0x7fffffffe1f0: 0x0000000000000000  0x00000000004003e0
0x7fffffffe200: 0x00007fffffffe210  0x0000000000400520 //pointers
0x7fffffffe210: 0x0000000000000000  0x00000036d042139d
0x7fffffffe220: 0x0000000000000000  0x00007fffffffe2f8
0x7fffffffe230: 0x0000000100000000  0x0000000000400503
0x7fffffffe240: 0x0000000000000000  0xd3c0c92559feaed9
0x7fffffffe250: 0x00000000004003e0  0x00007fffffffe2f0
Run Code Online (Sandbox Code Playgroud)

最后,为什么用32位操作系统代替参数4,3,2和1 更高在比它前面提到的指针堆栈.为什么64位操作系统会将参数放在堆栈中比指针更低 我的印象是,传递的参数总是首先放在堆栈上(因此,由于堆栈朝向较小的地址增长,因此将存在于更大值的内存地址中).然后是保存的基指针和返回地址(因此基指针可以重置为其先前的值,并且可以返回调用函数).这是我在32位编译代码中观察到的行为,但不是64位版本.我有什么误会?如果我的问题不清楚,我感谢对此事的任何见解并道歉.请让我知道任何方式我可以更简洁(或者如果我在任何时候都是不正确的).

先感谢您.

Mat*_*ery 7

Linux使用64位ABI与32位ABI有很大不同:在64位世界中,参数通常在寄存器中传递,而不是在堆栈中传递.

加入之前printf(),你不是在栈上寻找论据,因为第一次(最多)6的整数或指针参数获得寄存器传输(在顺序%rdi,%rsi,%rdx,%rcx,%r8,%r9).

添加之后printf(),它们可能会在寄存器内容被随机播放的过程中保存在堆栈中printf()- 看一下程序集; 一旦你知道ABI的样子,这可能是显而易见的.