相关疑难解决方法(0)

I have a very performance-critical function in my system showing up as a number one profiling hotspot in specific contexts. It's in the middle of a k-means iteration (already multi-threaded using a parallel for processing sub-ranges of points in each worker thread).

ClusterPoint& pt = points[j];
pt.min_index = -1;
pt.min_dist = numeric_limits<float>::max();
for (int i=0; i …

Run Code Online (Sandbox Code Playgroud)

c++ optimization performance

Dra*_*rgy

2015 05-08

59
推荐指数

5
解决办法

2351
查看次数

编译器是否可以删除以下副本？

我仍然是一名新手程序员,我知道过早的优化很糟糕,但我也知道复制大量的东西也很糟糕.

我已经阅读了复制省略和它的同义词,但维基百科上的例子让我觉得复制省略只有在要完全构建的同时返回要返回的对象时才会发生.

那些像矢量这样的对象呢？当用作返回值时,它通常只在填充某些东西时才有意义.毕竟,可以手动实例化空矢量.

那么,它是否也适用于这样的情况？

简洁的风格:

vector<foo> bar(string baz)
{
    vector<foo> out;
    for (each letter in baz)
        out.push_back(someTable[letter]);

    return out;
}

int main()
{
     vector<foo> oof = bar("Hello World");
}

Run Code Online (Sandbox Code Playgroud)

我使用bar(矢量和输出,字符串文本)没有真正的麻烦,但上面的方式看起来更好,美观,并且意图.

c++ copy-elision

Eri*_*ius

2016 07-08

14
推荐指数

3
解决办法

990
查看次数

GCC优化技巧,它真的有用吗？

在查看有关优化的一些问题时,对于最有效地使用优化器的编码实践问题,这个接受的答案激起了我的好奇心.断言是局部变量应该用于函数中的计算,而不是输出参数.有人建议这将允许编译器进行额外的优化,否则不可能.

因此,为示例Foo类编写一段简单的代码并使用g ++ v4.4和-O2编译代码片段会产生一些汇编器输出(使用-S).汇编程序列表的部分只包含如下所示的循环部分.在检查输出时,两个循环似乎几乎相同,只有一个地址不同.该地址是第一个示例的输出参数或第二个示例的局部变量的指针.

无论是否使用局部变量,实际效果似乎都没有变化.所以问题分为3部分:

a)即使给出提示,GCC也没有进行额外的优化;

b)GCC 在两种情况下都成功优化,但不应该;

c)GCC是否在两种情况下都成功优化,并且正在生成C++标准定义的兼容输出？

这是未经优化的功能:

void DoSomething(const Foo& foo1, const Foo* foo2, int numFoo, Foo& barOut)
{
    for (int i=0; i<numFoo, i++)
    {
         barOut.munge(foo1, foo2[i]);
    }
}

Run Code Online (Sandbox Code Playgroud)

和相应的组装:

.L3:
    movl    (%esi), %eax
    addl    $1, %ebx
    addl    $4, %esi
    movl    %eax, 8(%esp)
    movl    (%edi), %eax
    movl    %eax, 4(%esp)
    movl    20(%ebp), %eax       ; Note address is that of the output argument
    movl    %eax, (%esp)
    call    _ZN3Foo5mungeES_S_
    cmpl    %ebx, 16(%ebp) …

Run Code Online (Sandbox Code Playgroud)

c++ optimization gcc coding-style

cas*_*der

2017 05-23

8
推荐指数

1
解决办法

2089
查看次数