虽然(i--)通过gcc和clang进行优化:为什么他们不使用sub/jnc？

l4m*_*4m2 9 c performance x86 assembly gcc

有些人在需要没有计数器或计数器的循环时编写这样的代码n-1, ..., 0:

while (i--) { ... }

Run Code Online (Sandbox Code Playgroud)

一个具体的例子:

volatile int sink;
void countdown_i_used() {
    unsigned i = 1000;
    while (i--) {
         sink = i;  // if i is unused, gcc optimizes it away and uses dec/jnz
    }
}

Run Code Online (Sandbox Code Playgroud)

在GCC 8.2(在Godbolt编译器资源管理器上),它被编译成

# gcc8.2 -O3 -march=haswell
.L2:
    mov     DWORD PTR sink[rip], eax
    dec     eax                      # with tune=generic,  sub eax, 1
    cmp     eax, -1
    jne     .L2

Run Code Online (Sandbox Code Playgroud)

在clang(https://godbolt.org/z/YxYZ95)上,如果不使用计数器,它会变成

if(i) do {...} while(--i);

Run Code Online (Sandbox Code Playgroud)

但如果使用,就像GCC一样

add esi, -1
cmp esi, -1
jnz lp

Run Code Online (Sandbox Code Playgroud)

但是,这似乎是一个更好的主意:

sub esi, 1
jnc lp

Run Code Online (Sandbox Code Playgroud)

为什么这两个编译器不会这样使用？

因为cmp方式更好？或者因为它们不会以这种方式节省空间而且速度几乎相同？

或者他们只是不考虑这个选项？

是的,这是一个错过的优化.Intel Sandybridge系列可以将sub/jcc宏熔合到单个uop中,因此sub/jnc可以在这些CPU上保存代码大小,x86指令和uop.

在其他CPU上(例如AMD只能将测试/ cmp与jcc融合在一起),这仍然可以节省代码大小,因此它至少会稍好一些.任何事情都不会更糟.

在https://bugs.llvm.org和https://gcc.gnu.org/bugzilla/上报告错过优化错误是个好主意.

@l4m2：您的更新中没有文字“jc”，您只是有一个编译器*可以*识别为进位检查的习惯用法。但是，通过恒定的行程计数，编译器可以看到循环何时结束，并以它显然喜欢的次优方式进行编译。如果您希望编译器开发人员更改 gcc 和 LLVM 以免搞砸，请报告错过优化的错误。 (2认同)

归档时间：	6 年，11 月前
查看次数：	154 次
最近记录：	6 年，11 月前

INC指令与ADD 1:重要吗？ 26

更多相关链接

关于Pointers To函数声明中的函数 23

509最小字符限制的基本原理 20

在x86中增量是一个整数原子？ 17

对签名数据进行逻辑右移 9

添加传递给gcc？ 8

在Chrome上使用带有Canvas的drawImage非常慢 8

汇编程序char输出 3

为什么这个内联汇编中的ror op无法正常工作？ 2

使用 GCC 为 Linux 设备驱动程序编译 Intel AVX 内在函数 2

为什么位是从右到左编号的？ 0

如何在C#中枚举枚举？ 3620

什么是依赖注入？ 2984

确定已安装的PowerShell版本 2543

如何将命令行参数传递给Node.js程序？ 2280

从已从磁盘中删除的Git存储库中删除多个文件 1294

jQuery获取特定的选项标签文本 1211

Subversion存储库中"分支","标记"和"主干"的含义是什么？ 1181

使用PHP"注意:未定义的变量","注意:未定义的索引"和"通知:未定义的偏移量" 1119

群集和非群集索引实际上意味着什么？ 1041

功能编程是否取代了GoF设计模式？ 1028