Vin*_*ent 0 c++ assembly increment compiler-optimization clang++
在C++中考虑以下代码:
#include <cstdlib>
std::size_t count(std::size_t n)
{
std::size_t i = 0;
while (i < n) {
asm volatile("": : :"memory");
++i;
}
return i;
}
int main(int argc, char* argv[])
{
return count(argc > 1 ? std::atoll(argv[1]) : 1);
}
Run Code Online (Sandbox Code Playgroud)
它只是一个递增其值的循环,并在最后返回它.所述asm volatile防止环路它被优化.我们编译下g++ 8.1和clang++ 5.0与争论-Wall -Wextra -std=c++11 -g -O3.
现在,如果我们看一下编译器资源管理器正在生成什么,我们有g++:
count(unsigned long):
mov rax, rdi
test rdi, rdi
je .L2
xor edx, edx
.L3:
add rdx, 1
cmp rax, rdx
jne .L3
.L2:
ret
main:
mov eax, 1
xor edx, edx
cmp edi, 1
jg .L25
.L21:
add rdx, 1
cmp rdx, rax
jb .L21
mov eax, edx
ret
.L25:
push rcx
mov rdi, QWORD PTR [rsi+8]
mov edx, 10
xor esi, esi
call strtoll
mov rdx, rax
test rax, rax
je .L11
xor edx, edx
.L12:
add rdx, 1
cmp rdx, rax
jb .L12
.L11:
mov eax, edx
pop rdx
ret
Run Code Online (Sandbox Code Playgroud)
对于clang ++:
count(unsigned long): # @count(unsigned long)
test rdi, rdi
je .LBB0_1
mov rax, rdi
.LBB0_3: # =>This Inner Loop Header: Depth=1
dec rax
jne .LBB0_3
mov rax, rdi
ret
.LBB0_1:
xor edi, edi
mov rax, rdi
ret
main: # @main
push rbx
cmp edi, 2
jl .LBB1_1
mov rdi, qword ptr [rsi + 8]
xor ebx, ebx
xor esi, esi
mov edx, 10
call strtoll
test rax, rax
jne .LBB1_3
mov eax, ebx
pop rbx
ret
.LBB1_1:
mov eax, 1
.LBB1_3:
mov rcx, rax
.LBB1_4: # =>This Inner Loop Header: Depth=1
dec rcx
jne .LBB1_4
mov rbx, rax
mov eax, ebx
pop rbx
ret
Run Code Online (Sandbox Code Playgroud)
理解g ++生成的代码并不复杂,循环是:
.L3:
add rdx, 1
cmp rax, rdx
jne .L3
Run Code Online (Sandbox Code Playgroud)
每次迭代递增rdx,并将其与rax存储循环大小的迭代进行比较.
现在,我不知道clang ++正在做什么.显然它使用dec,这对我来说很奇怪,我甚至不知道实际循环在哪里.我的问题如下:clang在做什么?
(我正在寻找有关clang汇编代码的注释,以描述每个步骤的操作及其实际工作原理).
该函数的作用是返回n,或者通过计数到达n并返回结果,或者简单地返回传入的值n.铿锵代码执行后者.计数循环在这里:
mov rax, rdi
.LBB0_3: # =>This Inner Loop Header: Depth=1
dec rax
jne .LBB0_3
mov rax, rdi
ret
Run Code Online (Sandbox Code Playgroud)
它首先复制ninto 的值rax.它递减值rax,如果结果不为0,则跳回.LBB0_3.如果值是 0,则落空至下一条指令,这副本的原始值n进入rax和回报.
没有i存储,但代码执行循环规定的次数,并返回i本来会有的值,即n.