相关疑难解决方法(0)

优化级别-O3在g ++中是危险的吗？

我从各种来源(虽然大多数来自我的同事)中听到过,-O3用g ++ 的优化级别进行编译在某种程度上是"危险的",并且除非被证明是必要的,否则应该避免.

这是真的,如果是的话,为什么？我应该坚持-O2吗？

c++ optimization g++ compiler-flags

Dun*_*nie

2018 07-18

217
推荐指数

4
解决办法

10万
查看次数

numpy 怎么这么快？

numpy基于我与优化的 C/C++ 代码的令人震惊的比较，我试图了解怎么能这么快，这仍然远不能重现 numpy 的速度。

考虑以下示例：给定一个带有shape=(N, N)和的二维数组dtype=float32，它表示 N 维的 N 个向量的列表，我正在计算每对向量之间的成对差异。使用numpy广播，这简单地写为：

def pairwise_sub_numpy( X ):
    return X - X[:, None, :]

Run Code Online (Sandbox Code Playgroud)

使用timeit我可以测量性能N=512：在我的笔记本电脑上每次通话需要 88 毫秒。

现在，在 C/C++ 中，一个简单的实现写为：

#define X(i, j)     _X[(i)*N + (j)]
#define res(i, j, k)  _res[((i)*N + (j))*N + (k)]

float* pairwise_sub_naive( const float* _X, int N ) 
{
    float* _res = (float*) aligned_alloc( 32, N*N*N*sizeof(float));

    for (int i = 0; i < N; i++) {
        for …

Run Code Online (Sandbox Code Playgroud)

c c++ arrays performance numpy

jer*_*111

2021 01-26

61
推荐指数

2
解决办法

1827
查看次数

我应该优化多少？

关于编译器(GCC)所做的优化,标准做法是什么？每个选项(-O,-O1,-O2,-O3,-Os,-s,-fexpensive-optimizations)的作用有何不同,我如何确定最佳选项？

gcc compiler-flags compiler-optimization

作者

lucky-day

11
推荐指数

1
解决办法

2456
查看次数

优化的执行时间

由于学校作业,我必须将C++代码转换为程序集(ARMv8).然后我必须使用GCC的-O0,-O1,-O2,-O3和-Os优化来编译C++代码,记下时间并与汇编代码的执行时间进行比较.因为,我想我知道-O3必须比-O1和-O2快.但是,我得到-O2是最快的,然后是-O1,-O3,-Os,-O0.这是通常的吗？(计算的时间约为30秒).

c++ optimization gcc compilation

Mon*_*nia

2017 11-23

7
推荐指数

1
解决办法

454
查看次数

即使是简单的功能func也不会内联.无相结合inline,extern,static,并__attribute__((always_inline))在样机和/或定义改变了这种(这些说明的一些明显的组合,导致它甚至不会编译和/或产生警告,不谈论那些).我正在使用g++ *.cpp -O3 -o run和g++ *.cpp -O3 -S组装输出.当我看到装配输出时,我仍然看到call func.它似乎只有我能够正确内联函数的方法是拥有原型(可能没有必要)和头文件中函数的定义.如果标题只包含在整个程序中的一个文件中(仅main.cpp作为例子包含),它将编译并且函数将被正确内联,甚至不需要inline符.如果要将标头包含在多个文件中,则inline需要使用说明符来解决多个定义错误,这似乎是其唯一目的.该功能当然可以正确内联.