wat*_*dog 5 c++ clang c++11 c++17
我发现clang 8.x不会忽略gcc和msvc没问题的模板化类对象的副本的情况。在我的实际应用程序中,这种多余的副本非常昂贵,因此我试图深入了解它,并最终更好地了解了何时在C ++ 17中执行复制省略。
该问题显示在下面的代码片段中。以自动返回类型声明的,返回命名类对象的函数在其主体中具有一个额外的副本构造。如果将返回值重新编码为返回未命名的临时值,则会发生省略。如果对函数进行了编码以显式返回该类的实例(而不是auto),则会发生省略。
如果结构A没有模板参数,那么还将生成完全省略的代码。
该问题表明是否所有内容都不例外或允许内联(NOINLINE可以使您无需执行代码即可在Godbolt中查看问题)。
// compiled with -O2 -std=c++17
#if defined(_MSC_VER) && !defined(__clang__)
#define NOINLINE __declspec(noinline)
#else
#define NOINLINE __attribute__((noinline))
#endif
template<int P>
struct A {
int data = 0;
NOINLINE explicit A(int data_) noexcept : data(data_) { }
NOINLINE ~A() noexcept { }
NOINLINE A(const A& other) noexcept : data(other.data) { }
};
template <int P>
NOINLINE auto return_auto_A_nrvo(const A<P>& a) noexcept {
/* clang 6.0 thru 8.0 doesn't elide copy of 'result':
gcc and msvc elide the copy as expected.
mov r14, rsp
mov rdi, r14
call A<0>::A(A<0> const&)
mov rdi, rbx
mov rsi, r14
call A<0>::A(A<0> const&)
mov rdi, r14
call A<0>::~A() [base object destructor]
* return A<P>(a); is fully optimized
*/
A<P> result(a);
return result;
}
template <int P>
NOINLINE A<P> return_A_nrvo(const A<P>& a) noexcept {
// NRVO with explicit return type: fully optimized
A<P> result(a);
return result;
}
template <int P>
NOINLINE auto return_auto_A_rvo(const A<P>& a) noexcept {
// RVO: fully optimized
return A<P>(a);
}
NOINLINE int main() {
auto a1 = A<1>(42);
auto a2 = return_auto_A_nrvo(a1);
auto a3 = return_A_nrvo(a1);
auto a4 = return_auto_A_rvo(a1);
return a2.data + a3.data + a4.data;
}
Run Code Online (Sandbox Code Playgroud)
函数return_auto_A_nrvo()中的注释显示了由clang生成的带有未删除副本的代码。其他变体均生成完全省略的代码。如果类A没有模板参数,则该副本也将被删除。
该Godbolt链接显示了由GCC,clang和msvc生成的代码:https : //www.godbolt.org/z/FDAvQO。
也许这只是clang错过而Brands G和M不会错过的错误/错过的优化机会。如果是这种情况,我将尝试找到合适的发布位置,以供c族修复。但是我觉得这里可能会有更深层次的事情发生,例如返回auto和返回模板化类对象之间的根本区别。我相信C ++ 17保证将始终出现未命名的RVO,但不能保证像我这样的命名的RVO -我想了解为什么会这样(以及为什么在这里适用)。
正如您所怀疑的,编译器不需要在此处删除副本,因此这更像是“错过的机会”
\n\n[class.copy.elision] 表示在这种情况下编译器可以省略,但不是必需的。
\n\n\n\n[...] 这种复制/移动操作的省略,称为复制省略,在以下情况下是允许的(可以组合起来消除多个副本):
\n
\n \xe2\x80\x94 在函数的return语句中类的返回类型,当表达式是与函数返回类型具有相同类型(忽略 cv 限定)的非易失性自动对象 [...] 的名称时,可以省略复制/移动操作通过直接构造自动对象\n到函数调用\xe2\x80\x99s返回对象中
| 归档时间: |
|
| 查看次数: |
119 次 |
| 最近记录: |