为什么gcc在按值传递普通结构时会发出不需要的内存访问?

Ser*_*ins 7 c++ assembly arm calling-convention

众所周知,一些没有非平凡复制的小结构,没有非平凡的dtor在寄存器中传递.

引用ARM程序调用标准:

大于32位的基本类型可以作为参数传递给函数调用,或者作为函数调用的结果返回.当这些类型在核心寄存器中时,以下规则适用:双字大小类型在两个连续寄存器中传递(例如,r0和r1,或r2和r3).寄存器的内容就好像该值是通过单个LDM指令从存储器表示加载的.

事实上,我可以轻松地用铿锵声证实这一点.然而,gcc为这样一个简单的代码片段发出了大量的内存加载和存储:

struct Trivial {
    int i1;
    int i2;
};

int foo(Trivial t)
{
    return t.i1 + t.i2;
}
Run Code Online (Sandbox Code Playgroud)
$ clang++ arm.cpp -O2 -mabi=aapcs -c -S && cat arm.s

add r0, r0, r1
bx  lr
Run Code Online (Sandbox Code Playgroud)
$ g++ arm.cpp -O2 -mabi=aapcs -c -S && cat arm.s

sub     sp, sp, #8
add     r3, sp, #8
stmdb   r3, {r0, r1}
ldmia   sp, {r0, r3}
add     r0, r0, r3
add     sp, sp, #8
bx      lr
Run Code Online (Sandbox Code Playgroud)

我正在使用由ArchlinuxARM发行版提供的gcc和clang,在raspberry pi 2(gcc 5.2)上运行,但我也用基于gcc的交叉编译器再现它.

Ser*_*ins 2

这已被确认为 gcc bug ,现在我们等待。