iBu*_*Bug 1 c printf variadic-functions
考虑以下代码:
#include <stdio.h>
int main() {
printf("%lf %ld\n", 1234.0, 5678L);
printf("%lf %ld\n", 5678L, 1234.0);
}
Run Code Online (Sandbox Code Playgroud)
两次调用都printf打印相同的 text 1234.000000 5678,这与第二次调用的代码不太匹配(可能应该是5678.0000 1234)。
我使用的是 x86-64 处理器上的 Linux 4.x,但我无法在 x86(32 位)上重现这一点。我认为它可以在 amd64 架构上的任何 Linux 系统上重现。
为什么交换的参数为 提供相同的输出printf,以及为什么它特定于 x86-64?
答案是因为 System V ABI x86-64 就是这样定义参数应该如何传递的。
根据PDF第 22 页,前 6 个整数参数在 %rdi、%rsi、%rdx、%rcx、%r8、%r9 上传递,前 8 个浮点参数从 %xmm0 传递到 %xmm7。但是,整数和浮点数之间没有特定的顺序。因此,以下两个函数尽管定义不同,但行为相同。
int f1(int i1, int i2, int i3, double d1, double d2, double d3);
int f2(double d1, double d2, int i1, int i2, double d3, int i3);
Run Code Online (Sandbox Code Playgroud)
按照 Syetem V x86-64 ABI 进行编译时,两个函数都将在寄存器 %rdi、%rsi 和 %rdx 中接收 i1、i2 和 i3,以及在寄存器 %xmm0、%xmm1、%xmm2 中接收 d1、d2 和 d3。
可变参数也不例外。最多 6 个整数和最多 8 个浮点数通过寄存器传递,其余的在堆栈上传递。
谈到这段具体代码,通过检查 生成的汇编代码gcc -O0 -S,我验证了上面的说法:整数 5678 通过 %rsi 发送到 printf,(双精度)浮点值 1234.0 通过 %xmm0 发送到 printf 。在这两种情况下,%eax 都设置为 1,表示有一个可用的浮点参数。
哦,是的,%rdi 在哪里?实际上,格式化字符串是第一个参数,因此指向该字符串的指针是通过 %rdi 传递的。
printf 不知道整数是在浮点数之前还是相反,它只知道它有一个整数参数(在格式化字符串之后)和一个浮点参数(读取 %al)。这正是两条线路产生相同输出的原因。
TODO:有人在这里放了 Godbolt 链接吗?