Chi*_*ffa 84 c++ performance operators
我正在阅读Stroustrup的"The C++ Programming Language",他说有两种方法可以向变量添加内容
x = x + a;
Run Code Online (Sandbox Code Playgroud)
和
x += a;
Run Code Online (Sandbox Code Playgroud)
他更喜欢,+=
因为它最有可能更好地实施.我认为他的意思是它的工作速度也更快.
但它真的吗?如果它取决于编译器和其他东西,我该如何检查?
zwo*_*wol 210
任何编译器称职将产生正是为了既构建了相同的机器语言序列中的任何内置类型(int
,float
,等),只要该语句确实是非常简单x = x + a;
和优化启用.(值得注意的是,GCC -O0
是默认模式,执行反优化,例如将完全不必要的存储插入内存,以确保调试器始终可以找到变量值.)
但是,如果声明更复杂,它们可能会有所不同.假设f
是一个返回指针的函数
*f() += a;
Run Code Online (Sandbox Code Playgroud)
f
只召唤一次,而
*f() = *f() + a;
Run Code Online (Sandbox Code Playgroud)
叫它两次.如果f
有副作用,两者之一将是错误的(可能是后者).即使f
没有副作用,编译器也可能无法消除第二次调用,因此后者可能确实更慢.
既然我们在这里讨论的是C++,那么重载operator+
和类的类类型的情况就完全不同了operator+=
.如果x
是这样的类型,那么 - 在优化之前 - x += a
转换为
x.operator+=(a);
Run Code Online (Sandbox Code Playgroud)
而x = x + a
翻译成
auto TEMP(x.operator+(a));
x.operator=(TEMP);
Run Code Online (Sandbox Code Playgroud)
现在,如果正确编写了类并且编译器的优化器足够好,那么它们最终都会生成相同的机器语言,但它不像内置类型那样可靠.这可能是Stroustrup鼓励使用时的想法+=
.
Luc*_*ore 56
您可以通过查看dissasembly进行检查,这将是相同的.
对于基本类型,两者都同样快.
这是由调试版本生成的输出(即没有优化):
a += x;
010813BC mov eax,dword ptr [a]
010813BF add eax,dword ptr [x]
010813C2 mov dword ptr [a],eax
a = a + x;
010813C5 mov eax,dword ptr [a]
010813C8 add eax,dword ptr [x]
010813CB mov dword ptr [a],eax
Run Code Online (Sandbox Code Playgroud)
对于用户定义的类型,在这里你可以过载operator +
和operator +=
,这取决于它们各自的实现.
Mar*_*ler 11
是! 在x
可能有副作用的情况下,对于后者来说,写入更快,阅读更快,更快更好.所以它对人类来说总体上更快.人的时间一般比计算机时间花费的多,所以这一定是你所要求的.对?
它实际上取决于x和a的类型以及+的实现.对于
T x, a;
....
x = x + a;
Run Code Online (Sandbox Code Playgroud)
编译器必须创建一个临时T来包含x + a的值,同时它对它进行求值,然后它可以分配给x.(在此操作期间,不能使用x或a作为工作空间).
对于x + = a,它不需要临时的.
对于琐碎的类型,没有区别.
x = x + a
和之间的差异x += a
是机器必须经历的工作量 - 一些编译器可能(通常会)优化它,但通常,如果我们忽略优化一段时间,会发生的事情是在前一段代码片段中,机器必须查找x
两次的值,而在后一种情况下,此查找只需要发生一次.
但是,正如我所提到的,今天大多数编译器都足够聪明,可以分析指令并减少所需的机器指令.
PS:Stack Overflow的第一个答案!
正如你已经标注了这个C++,没有办法从你发布的两个语句中知道.你需要知道'x'是什么(它有点像答案'42').如果x
是POD,那么它实际上并没有太大的区别.但是,如果x
是一个类,则可能存在导致执行时间差异的不同行为的方法operator +
和operator +=
方法的重载.
你问的是错误的问题.
这不太可能推动应用程序或功能的性能.即使它是,但找出的方法是分析代码并知道它对你的影响.在清晰度,正确性和可读性方面考虑更重要的是,不要担心这个级别哪个更快.
当您考虑到这一点时尤其如此,即使这是一个重要的性能因素,编译器也会在一段时间内发展.有人可能会想出一个新的优化,今天的正确答案可能会在明天变得错误.这是过早优化的经典案例.
这并不是说性能根本不重要......只是这是实现你的性能目标的错误方法.正确的方法是使用分析工具来了解代码实际花费时间的位置,从而集中精力.
如果你说+=
你让编译器的生活变得更容易.为了使编译器能够识别出与编译器x = x+a
相同的内容x += a
,编译器必须这样做
分析左侧(x
)以确保它没有副作用并始终引用相同的l值.例如,它可能是z[i]
,它必须确保两个z
和i
不改变.
分析右手边(x+a
)并确保它是一个求和,并且左手边在右边出现一次,即使它可以被转换,如同z[i] = a + *(z+2*0+i)
.
如果你的意思是添加a
到x
,编译器作者赞赏它,当你刚刚说你的意思.那样的话,你没有运用编译器希望他/她得到所有错误的编译器的一部分,这实际上并没有让你的生活变得更容易,除非你真的不能理解你的想法Fortran模式.
举一个具体的例子,想象一个简单的复数类型:
struct complex {
double x, y;
complex(double _x, double _y) : x(_x), y(_y) { }
complex& operator +=(const complex& b) {
x += b.x;
y += b.y;
return *this;
}
complex operator +(const complex& b) {
complex result(x+b.x, y+b.y);
return result;
}
/* trivial assignment operator */
}
Run Code Online (Sandbox Code Playgroud)
对于a = a + b的情况,它必须创建一个额外的临时变量然后复制它.