fug*_*ede 5 gcc sse x86-64 calling-convention msys2
考虑下面的C程序.
#include <stdio.h>
#include <stdlib.h>
int main(int argc, char* argv[]) {
double x = 4.5;
double x2 = atof("3.5");
printf("%.6f\n", x);
printf("%.6f\n", x2);
return 0;
}
Run Code Online (Sandbox Code Playgroud)
使用MSYS2提供的GCC版本进行编译时,输出最终取决于SSE的可用性:
$ gcc test.c && ./a.exe
4.500000
3.500000
$ gcc -mno-sse test.c && ./a.exe
4.500000
0.000000
Run Code Online (Sandbox Code Playgroud)
这种行为是否有意义,如果没有,是否有任何方法让GCC在这种情况下产生合理的结果(除了简单的删除之外的解决方案之外-mno-sse
)?这是一些版本信息:
$ gcc -v
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-pc-msys/7.3.0/lto-wrapper.exe
Target: x86_64-pc-msys
Configured with: /msys_scripts/gcc/src/gcc-7.3.0/configure --build=x86_64-pc-msys --prefix=/usr --libexecdir=/usr/lib --
enable-bootstrap --enable-shared --enable-shared-libgcc --enable-static --enable-version-specific-runtime-libs --with-ar
ch=x86-64 --with-tune=generic --disable-multilib --enable-__cxa_atexit --with-dwarf2 --enable-languages=c,c++,fortran,lt
o --enable-graphite --enable-threads=posix --enable-libatomic --enable-libcilkrts --enable-libgomp --enable-libitm --ena
ble-libquadmath --enable-libquadmath-support --disable-libssp --disable-win32-registry --disable-symvers --with-gnu-ld -
-with-gnu-as --disable-isl-version-check --enable-checking=release --without-libiconv-prefix --without-libintl-prefix --
with-system-zlib --enable-linker-build-id --with-default-libstdcxx-abi=gcc4-compatible
Thread model: posix
gcc version 7.3.0 (GCC)
Run Code Online (Sandbox Code Playgroud)
这是拆解的结果main
:
0x0000000100401080 <+0>: push %rbp
0x0000000100401081 <+1>: mov %rsp,%rbp
0x0000000100401084 <+4>: sub $0x30,%rsp
0x0000000100401088 <+8>: mov %ecx,0x10(%rbp)
0x000000010040108b <+11>: mov %rdx,0x18(%rbp)
0x000000010040108f <+15>: callq 0x1004010f0 <__main>
0x0000000100401094 <+20>: fldl 0x1f76(%rip) # 0x100403010
0x000000010040109a <+26>: fstpl -0x8(%rbp)
0x000000010040109d <+29>: lea 0x1f5c(%rip),%rcx # 0x100403000
0x00000001004010a4 <+36>: callq 0x100401100 <atof>
0x00000001004010a9 <+41>: mov %rax,-0x10(%rbp)
0x00000001004010ad <+45>: mov -0x8(%rbp),%rax
0x00000001004010b1 <+49>: mov %rax,%rdx
0x00000001004010b4 <+52>: lea 0x1f49(%rip),%rcx # 0x100403004
0x00000001004010bb <+59>: callq 0x100401110 <printf>
0x00000001004010c0 <+64>: mov -0x10(%rbp),%rax
0x00000001004010c4 <+68>: mov %rax,%rdx
0x00000001004010c7 <+71>: lea 0x1f36(%rip),%rcx # 0x100403004
0x00000001004010ce <+78>: callq 0x100401110 <printf>
0x00000001004010d3 <+83>: mov $0x0,%eax
0x00000001004010d8 <+88>: add $0x30,%rsp
0x00000001004010dc <+92>: pop %rbp
0x00000001004010dd <+93>: retq
0x00000001004010de <+94>: nop
0x00000001004010df <+95>: nop
Run Code Online (Sandbox Code Playgroud)
值得注意的是,尝试在Linux版本的GCC上编译相同的程序会产生错误(出于此问题中讨论的原因):
$ gcc -mno-sse test2.c
test2.c: In function ‘main’:
test2.c:6:12: error: SSE register return with SSE disabled
double x2 = atof("3.5");
^~
$ gcc -v
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-linux-gnu/6/lto-wrapper
Target: x86_64-linux-gnu
Configured with: ../src/configure -v --with-pkgversion='Debian 6.3.0-18+deb9u1' --with-bugurl=file:///usr/share/doc/gcc-
6/README.Bugs --enable-languages=c,ada,c++,java,go,d,fortran,objc,obj-c++ --prefix=/usr --program-suffix=-6 --program-pr
efix=x86_64-linux-gnu- --enable-shared --enable-linker-build-id --libexecdir=/usr/lib --without-included-gettext --enabl
e-threads=posix --libdir=/usr/lib --enable-nls --with-sysroot=/ --enable-clocale=gnu --enable-libstdcxx-debug --enable-l
ibstdcxx-time=yes --with-default-libstdcxx-abi=new --enable-gnu-unique-object --disable-vtable-verify --enable-libmpx --
enable-plugin --enable-default-pie --with-system-zlib --disable-browser-plugin --enable-java-awt=gtk --enable-gtk-cairo
--with-java-home=/usr/lib/jvm/java-1.5.0-gcj-6-amd64/jre --enable-java-home --with-jvm-root-dir=/usr/lib/jvm/java-1.5.0-
gcj-6-amd64 --with-jvm-jar-dir=/usr/lib/jvm-exports/java-1.5.0-gcj-6-amd64 --with-arch-directory=amd64 --with-ecj-jar=/u
sr/share/java/eclipse-ecj.jar --with-target-system-zlib --enable-objc-gc=auto --enable-multiarch --with-arch-32=i686 --w
ith-abi=m64 --with-multilib-list=m32,m64,mx32 --enable-multilib --with-tune=generic --enable-checking=release --build=x8
6_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu
Thread model: posix
gcc version 6.3.0 20170516 (Debian 6.3.0-18+deb9u1)
Run Code Online (Sandbox Code Playgroud)
您应该从 msys gcc 收到相同的错误-mno-sse
。标准调用约定 (x64 Windows __fastcall
) 使用 xmm0..3(SSE 向量寄存器)来传递和返回float
和double
。
从您展示的 asm 来看main
,似乎-mno-sse
改变了 gcc 的调用约定的想法,以double
在整数寄存器中传递/返回,就像 ARM 上的软浮点一样。因此,存在调用约定不匹配的情况,实际发生的情况取决于汇编细节和机会。
Windows x64 调用约定有一个有趣的设计功能,使可变参数函数的实现更加printf
简单:调用可变参数函数时,该槽的整数和 XMM 寄存器都必须包含该值(https://learn.microsoft.com/en- gb/cpp/build/varargs?view=vs-2017)。因此,该函数可以将 rcx、rdx、r8 和 r9 转储到影子空间中,并形成一个 8 字节 args 数组(与堆栈 args 相邻),然后查看 args 以确定哪些是 FP,哪些是整数。(有关执行此操作的丑陋示例,请参阅如何在运行时在 Windows 上的 64 位应用程序中在程序集中设置函数参数?)与 x86-64 System V ABI 不同,第二个参数总体位于 XMM1 中,而不是第二个FP参数。因此,即使混合使用 FP 和整数,regs 中也只能包含 4 个参数。
因此,gccdouble
在 中传递位模式%rdx
实际上是有效的,因为该库printf
只关心 中的值%rdx
,而忽略 中的值%xmm1
。
但atof
在 XMM0 中返回,RAX 持有垃圾。您-mno-sse
main
使用保存 RAX 并将其传递给第二个 printf。它要么为零,要么非常小double
。
如果 RAX 持有地址,则高 16 位将为零,因此将该位模式类型双关到 IEEE double
( https://en.wikipedia.org/wiki/Double- precision_floating-point_format) 给出指数 = 0,以及一些有效数位。一个小的正整数会更小double
。
因此,您可能打印了一个非常小的次正规四舍五入double
到该格式,它来自RAX 返回 XMM0 中的值时留在 RAX 中的0
任何垃圾。atof
归档时间: |
|
查看次数: |
123 次 |
最近记录: |