Eli*_*sky 6 c assembly gcc x86-64 cpu-registers
我正在尝试使用x86-64程序集.编译了这个虚函数:
long myfunc(long a, long b, long c, long d,
long e, long f, long g, long h)
{
long xx = a * b * c * d * e * f * g * h;
long yy = a + b + c + d + e + f + g + h;
long zz = utilfunc(xx, yy, xx % yy);
return zz + 20;
}
Run Code Online (Sandbox Code Playgroud)
随着gcc -O0 -g我惊讶地发现,在函数的程序集的开头如下:
0000000000400520 <myfunc>:
400520: 55 push rbp
400521: 48 89 e5 mov rbp,rsp
400524: 48 83 ec 50 sub rsp,0x50
400528: 48 89 7d d8 mov QWORD PTR [rbp-0x28],rdi
40052c: 48 89 75 d0 mov QWORD PTR [rbp-0x30],rsi
400530: 48 89 55 c8 mov QWORD PTR [rbp-0x38],rdx
400534: 48 89 4d c0 mov QWORD PTR [rbp-0x40],rcx
400538: 4c 89 45 b8 mov QWORD PTR [rbp-0x48],r8
40053c: 4c 89 4d b0 mov QWORD PTR [rbp-0x50],r9
400540: 48 8b 45 d8 mov rax,QWORD PTR [rbp-0x28]
400544: 48 0f af 45 d0 imul rax,QWORD PTR [rbp-0x30]
400549: 48 0f af 45 c8 imul rax,QWORD PTR [rbp-0x38]
40054e: 48 0f af 45 c0 imul rax,QWORD PTR [rbp-0x40]
400553: 48 0f af 45 b8 imul rax,QWORD PTR [rbp-0x48]
400558: 48 0f af 45 b0 imul rax,QWORD PTR [rbp-0x50]
40055d: 48 0f af 45 10 imul rax,QWORD PTR [rbp+0x10]
400562: 48 0f af 45 18 imul rax,QWORD PTR [rbp+0x18]
Run Code Online (Sandbox Code Playgroud)
gcc 非常奇怪地将所有参数寄存器溢出到堆栈中,然后将它们从内存中取出以进行进一步操作.
这只发生在-O0(-O1没有问题),但仍然,为什么?这看起来像是对我的反优化 - 为什么gcc会这样做?
我绝不是GCC的内部专家,但我会试一试.不幸的是,关于GCC注册分配和溢出的大多数信息似乎都已过时(引用这样的文件local-alloc.c不再存在).
我在看源代码gcc-4.5-20110825.
在GNU C Compiler Internals中,提到初始函数代码由expand_function_startin 生成gcc/function.c.我们在处理参数时发现以下内容:
4462 /* Initialize rtx for parameters and local variables.
4463 In some cases this requires emitting insns. */
4464 assign_parms (subr);
Run Code Online (Sandbox Code Playgroud)
在assign_parms处理每个参数存储位置的代码中,如下所示:
3207 if (assign_parm_setup_block_p (&data))
3208 assign_parm_setup_block (&all, parm, &data);
3209 else if (data.passed_pointer || use_register_for_decl (parm))
3210 assign_parm_setup_reg (&all, parm, &data);
3211 else
3212 assign_parm_setup_stack (&all, parm, &data);
Run Code Online (Sandbox Code Playgroud)
assign_parm_setup_block_p处理聚合数据类型,在这种情况下不适用,因为数据不作为指针GCC检查传递use_register_for_decl.
这里的相关部分是:
1972 if (optimize)
1973 return true;
1974
1975 if (!DECL_REGISTER (decl))
1976 return false;
Run Code Online (Sandbox Code Playgroud)
DECL_REGISTER测试变量是否使用register关键字声明.现在我们得到了答案:当未启用优化时,大多数参数都存在于堆栈中,然后由其处理assign_parm_setup_stack.在源代码最终溢出值之前获取的路由对于指针参数稍微复杂一些,但如果您好奇,可以在同一文件中跟踪.
为什么GCC会在禁用优化的情况下溢出所有参数和局部变量?帮助调试.考虑这个简单的功能:
1 extern int bar(int);
2 int foo(int a) {
3 int b = bar(a | 1);
4 b += 42;
5 return b;
6 }
Run Code Online (Sandbox Code Playgroud)
使用gcc -O1 -c此编译在我的机器上生成以下内容:
0: 48 83 ec 08 sub $0x8,%rsp
4: 83 cf 01 or $0x1,%edi
7: e8 00 00 00 00 callq c <foo+0xc>
c: 83 c0 2a add $0x2a,%eax
f: 48 83 c4 08 add $0x8,%rsp
13: c3 retq
Run Code Online (Sandbox Code Playgroud)
哪个是好的,除非你在第5行打破并尝试打印a的值,你得到
(gdb) print a
$1 = <value optimized out>
Run Code Online (Sandbox Code Playgroud)
因为参数被覆盖,因为它在调用之后没有被使用bar.
有几个原因:
当您正在查看-O0代码时,请考虑编译器的首要任务是尽可能减少编译时间并生成高质量的调试信息.
| 归档时间: |
|
| 查看次数: |
1551 次 |
| 最近记录: |