为什么GCC没有优化这个尾调用?

Jak*_* M. 2 c

我有使用内联列表的代码.我用尾调用.不幸的是,GCC没有优化通话.

这是递归计算链表长度的函数的C代码:

size_t ll_length(const ll_t* list) {
    return ll_length_rec(list, 0);
}

size_t ll_length_rec(const ll_t* list, size_t size_so_far)
{
    if (list)   {
        return ll_length_rec(list->next, size_so_far + 1);
    } else {
        return size_so_far;
    }
}
Run Code Online (Sandbox Code Playgroud)

这是汇编程序代码:

.globl _ll_length_rec
_ll_length_rec:
LFB8:
    .loc 1 47 0
    pushq   %rbp
LCFI6:
    movq    %rsp, %rbp
LCFI7:
    subq    $32, %rsp
LCFI8:
    movq    %rdi, -8(%rbp)
    movq    %rsi, -16(%rbp)
    .loc 1 48 0
    cmpq    $0, -8(%rbp)
    je  L8
    .loc 1 49 0
    movq    -16(%rbp), %rsi
    incq    %rsi
    movq    -8(%rbp), %rax
    movq    8(%rax), %rdi
    call    _ll_length_rec  # < THIS SHOUD BE OPTIMIZED
    movq    %rax, -24(%rbp)
    jmp L10
Run Code Online (Sandbox Code Playgroud)

如果GCC会优化它,那么callasm 就没有了.我编译它:

gcc  -S -fnested-functions -foptimize-sibling-calls \
    -03 -g -Wall -o llist llist.c
Run Code Online (Sandbox Code Playgroud)

和GCC版本是:

i686-apple-darwin10-gcc-4.2.1 (GCC) 4.2.1 (Apple Inc. build 5666) (dot 3)
Run Code Online (Sandbox Code Playgroud)

Joa*_*son 9

如果我添加-O3到你的编译行,它似乎不会产生有问题的调用,而没有它,我得到未经优化的调用.我不知道在我的脑海所有GCC选项,而是-03一个错字的-O3或故意的吗?

Ltmp2:
        pushq   %rbp
Ltmp0:
        movq    %rsp, %rbp
Ltmp1:
        jmp     LBB1_1
        .align  4, 0x90
LBB1_3:
        addq    $2, %rsi
Ltmp3:
        movq    (%rax), %rdi
Ltmp4:
LBB1_1:
Ltmp5:
        testq   %rdi, %rdi
        je      LBB1_5
Ltmp6:
        movq    (%rdi), %rax
        testq   %rax, %rax
        jne     LBB1_3
        incq    %rsi
LBB1_5:
        movq    %rsi, %rax
Ltmp7:
Ltmp8:
        popq    %rbp
        ret
Run Code Online (Sandbox Code Playgroud)