在特定情况下,为什么gccgo比gc慢?

6 go gprof

我敢肯定,每个人都知道golang知道,博客文章在这里.

再次阅读,我想知道是否使用gccgo而不是go build会增加速度.在我的典型用例(科学计算)中,gccgo生成的二进制文件总是比生成的二进制文件更快go build.

所以,只需抓住这个文件:havlak6.go并编译它:

go build havlak6.go -O havlak6_go
gccgo -o havlak6_gccgo -march=native -Ofast havlak6.go
Run Code Online (Sandbox Code Playgroud)

惊喜!

$/usr/bin/time ./havlak6_go
5.45user 0.06system 0:05.54elapsed 99%CPU

$/usr/bin/time ./havlak6_gccgo
11.38user 0.16system 0:11.74elapsed 98%CPU
Run Code Online (Sandbox Code Playgroud)

我很好奇并且想知道为什么"优化"编译器会产生较慢的代码.

我试图gprofgccgo生成的二进制文件上使用:

gccgo -pg -march=native -Ofast havlak6.go
./a.out
gprof a.out gmon.out
Run Code Online (Sandbox Code Playgroud)

没有运气:

Flat profile:

Each sample counts as 0.01 seconds.
 no time accumulated
Run Code Online (Sandbox Code Playgroud)

如您所见,代码尚未实际分析.

当然,我读过这篇文章,但正如你所看到的,程序执行需要10多秒......样本数应该> 1000.

我也尝试过:

rm a.out gmon.out
LDFLAGS='-g -pg' gccgo -g -pg -march=native -Ofast havlak6.go
./a.out
gprof
Run Code Online (Sandbox Code Playgroud)

也没有成功.

你知道什么是错的吗?你有没有想过为什么gccgo,它的所有优化程序都不能比gc这种情况更快?

go版本:1.0.2 gcc版本:4.7.2

编辑:

哦,我完全忘了提...我显然在gccgo生成的二进制文件上尝试了pprof ...这是一个top10:

Welcome to pprof!  For help, type 'help'.
(pprof) top10
Total: 1143 samples
    1143 100.0% 100.0%     1143 100.0% 0x00007fbfb04cf1f4
       0   0.0% 100.0%      890  77.9% 0x00007fbfaf81101e
       0   0.0% 100.0%        4   0.3% 0x00007fbfaf8deb64
       0   0.0% 100.0%        1   0.1% 0x00007fbfaf8f2faf
       0   0.0% 100.0%        3   0.3% 0x00007fbfaf8f2fc5
       0   0.0% 100.0%        1   0.1% 0x00007fbfaf8f2fc9
       0   0.0% 100.0%        1   0.1% 0x00007fbfaf8f2fd6
       0   0.0% 100.0%        1   0.1% 0x00007fbfaf8f2fdf
       0   0.0% 100.0%        2   0.2% 0x00007fbfaf8f4a2f
       0   0.0% 100.0%        1   0.1% 0x00007fbfaf8f4a33
Run Code Online (Sandbox Code Playgroud)

这就是为什么我在寻找别的东西.

EDIT2:

由于似乎有人希望我的问题被关闭,我没有尝试使用gprof蓝色:https://groups.google.com/d/msg/golang-nuts/1xESoT5Xcd0/bpMvxQeJguMJ

小智 2

在 Valgrind 下运行 gccgo 生成的二进制文件似乎表明gccgo内存分配器效率低下。gccgo这可能是4.7.2比1.0.2慢的原因之一go。go 1.0.2 生成的二进制文件无法在 Valgrind 下运行,因此很难确认这种情况下内存分配是否是 gccgo 的主要性能问题。