这是从Efficient方式返回c ++中的std :: vector的扩展问题
#include <cstdio>
#include <vector>
#include <chrono>
std::vector<int> func1() {
std::vector<int> v;
v.reserve(1e6);
for (int i = 0; i < 1e6; i++) v.emplace_back(i);
return v;
}
std::vector<int> func2() {
std::vector<int> v;
v.reserve(1e6);
for (int i = 0; i < 1e6; i++) v.emplace_back(i);
return std::move(v);
}
int main() {
auto start1 = std::chrono::steady_clock::now();
std::vector<int> v1 = func1();
auto end1 = std::chrono::steady_clock::now();
printf("%d\n", std::chrono::duration_cast<std::chrono::nanoseconds>(end1-start1).count());
auto start2 = std::chrono::steady_clock::now();
std::vector<int> v2 = func2();
auto end2 = std::chrono::steady_clock::now();
printf("%d\n", std::chrono::duration_cast<std::chrono::nanoseconds>(end2-start2).count());
/*
auto start3 = std::chrono::steady_clock::now();
std::vector<int> v3 = v2;
auto end3 = std::chrono::steady_clock::now();
printf("%d\n", std::chrono::duration_cast<std::chrono::nanoseconds>(end3-start3).count());
*/
return 0;
}
Run Code Online (Sandbox Code Playgroud)
在方法2中,我明确地告诉编译器我要移动而不是复制向量,但是多次运行代码表明方法1实际上有时胜过方法2,即使方法2获胜,也不是很多.
方法3始终是最好的.当我必须从函数返回时如何模拟方法3?(不,我不能通过参考传递)
使用gcc 6.1.0
方法1 - 您正在使用Named Return Value Optimization (NRVO).实际上,这是最好的,因为在优化的代码中根本没有构造临时对象.如果编译器无法生成NRVO,它将使用移动语义,与方法2中的相同.
方法2 - 您实际上正在关闭NRVO,并强制移动构造函数用于目标std :: vector.所以,这不如方法1那么好.
方法3 - 实际上,你在这里复制向量,这是迄今为止最糟糕的表现.但是,由于您在一次传递中复制了矢量(一个大块内存,而不是许多项目) - 您获得了最佳性能,但这在方法1或2中的用例中是不可复制的.
NRVO如何运作?当你只有一个返回值时:在这种情况下std::vector<int> v,编译器根本不在函数内创建这个向量.它会创建未命名的右值向量,您将返回该向量,并将对它的引用传递给您的函数.
这样的事情将在优化的代码中发生:
std::vector<int> func1(std::vector<int>& hidden) {
hidden.emplace_back(stuff);
return;
}
Run Code Online (Sandbox Code Playgroud)