Bre*_* So 4 optimization clang ssa compiler-optimization llvm-codegen
我目前正在玩LLVM,我正在尝试编写一些优化器来熟悉opt和clang.我写了一个test.c文件,如下所示:
int foo(int aa, int bb, int cc){
int sum = aa + bb;
return sum/cc;
}
Run Code Online (Sandbox Code Playgroud)
我编译了源代码并生成了2个.ll文件,一个未经优化,一个用mem2reg优化器传递:
clang -emit-llvm -O0 -c test.c -o test.bc
llvm-dis test.bc
opt -mem2reg -S test.ll -o test-mem2reg.ll
Run Code Online (Sandbox Code Playgroud)
两个.ll文件都给了我以下输出:
ModuleID = 'test.bc'
source_filename = "test.c"
target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"
target triple = "x86_64-unknown-linux-gnu"
; Function Attrs: noinline nounwind optnone uwtable
define i32 @foo(i32 %aa, i32 %bb, i32 %cc) #0 {
entry:
%aa.addr = alloca i32, align 4
%bb.addr = alloca i32, align 4
%cc.addr = alloca i32, align 4
%sum = alloca i32, align 4
store i32 %aa, i32* %aa.addr, align 4
store i32 %bb, i32* %bb.addr, align 4
store i32 %cc, i32* %cc.addr, align 4
%0 = load i32, i32* %aa.addr, align 4
%1 = load i32, i32* %bb.addr, align 4
%add = add nsw i32 %0, %1
store i32 %add, i32* %sum, align 4
%2 = load i32, i32* %sum, align 4
%3 = load i32, i32* %cc.addr, align 4
%div = sdiv i32 %2, %3
ret i32 %div
}
attributes #0 = { noinline nounwind optnone uwtable "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-jump-tables"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="x86-64" "target-features"="+fxsr,+mmx,+sse,+sse2,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" }
!llvm.module.flags = !{!0}
!llvm.ident = !{!1}
!0 = !{i32 1, !"wchar_size", i32 4}
!1 = !{!"clang version 6.0.0 (trunk 314616)"}
Run Code Online (Sandbox Code Playgroud)
所以看来我的mem2reg传递不起作用!会出现什么问题?
小智 16
最近,当使用-O0编译时,clang开始optnone为每个函数添加属性,这阻止了之后的进一步优化,包括mem2reg传递.为了防止这种情况,请添加-Xclang -disable-O0-optnone到clang.
另一个答案已经指出,使用-O0(或不使用-O选项),您的函数会使用该optnone属性进行注释。降低优化级别的另一个影响是似乎没有生成 TBAA 元数据,这也会影响以后的优化。
因此,为了为 准备文件opt,我发现最好保持优化级别,并传递选项-Xclang -disable-llvm-passes(此选项的帮助文本为“与 -emit-llvm 一起使用,通过不运行从前端获取原始 LLVM IR”任何 LLVM 都通过”)。
完整的调用变为:
clang -S -emit-llvm -O -Xclang -disable-llvm-passes source.c
Run Code Online (Sandbox Code Playgroud)