这是我的macbook air结果在c ++中,执行时间:2.692秒
这是我的arduino代码.它在'for'之前和之后的微秒中得到时间.
差异是732微秒,其为0.000732秒

Sea*_*ine 13
让我们看一下MSVC如何在调试模式下编译代码,因为您似乎正在编译它...
unsigned int max = 1000000000L;
011643BE mov dword ptr [max],3B9ACA00h
for (unsigned int i=0; i<max; i++)
011643C5 mov dword ptr [ebp-14h],0
011643CC jmp main+37h (011643D7h)
011643CE mov eax,dword ptr [ebp-14h]
011643D1 add eax,1
011643D4 mov dword ptr [ebp-14h],eax
011643D7 mov eax,dword ptr [ebp-14h]
011643DA cmp eax,dword ptr [max]
for (unsigned int i=0; i<max; i++)
011643DD jae main+4Eh (011643EEh)
{
n++;
011643DF mov eax,dword ptr ds:[0116F218h]
011643E4 add eax,1
011643E7 mov dword ptr ds:[0116F218h],eax
}
011643EC jmp main+2Eh (011643CEh)
Run Code Online (Sandbox Code Playgroud)
好的,现在让我们看看在发布模式下......
unsigned int max = 1000000000L;
for (unsigned int i=0; i<max; i++)
00FC1270 mov eax,dword ptr ds:[00FC4430h]
{
n++;
}
std::cout << n;
00FC1275 mov ecx,dword ptr ds:[0FC3030h]
00FC127B add eax,3B9ACA00h
00FC1280 push eax
00FC1281 mov dword ptr ds:[00FC4430h],eax
00FC1286 call dword ptr ds:[0FC3038h]
Run Code Online (Sandbox Code Playgroud)
请注意区别?释放模式已完全优化了循环.
好的,现在让我们换档,看看Arduino是如何做到这一点的.准备好一些AVR asm ...
for(i=0; i<1000000000; i++)
{
n++;
}
Serial.println(n);
d8: c8 01 movw r24, r16
da: 40 e0 ldi r20, 0x00 ; 0
dc: 5a ec ldi r21, 0xCA ; 202
de: 6a e9 ldi r22, 0x9A ; 154
e0: 7b e3 ldi r23, 0x3B ; 59
e2: 2a e0 ldi r18, 0x0A ; 10
e4: 30 e0 ldi r19, 0x00 ; 0
e6: 0e 94 c4 04 call 0x988 ; 0x988 <_ZN5Print7printlnEli>
Run Code Online (Sandbox Code Playgroud)
哇!它也优化了循环!编译器是一个聪明的小bugger,不是吗?!?!
......当你想到它时,执行那么长时间的循环不是.0007秒快一点吗?这只是大约43个时钟周期的足够时间 - 几乎不足以召唤Serial.println().
AnT*_*AnT 12
首先,您编写的代码非常简单.根据编译器和编译器设置,此类代码的编译结果会有很大差异.正确配置的优化编译器通常会将其编译为最终值的明确赋值,n而不需要任何循环.或者它甚至可以n完全消除.在这种情况下,你真正测量的只是"空虚":一个程序的启动和终止时间几乎没有.
其次,您使用的测量方法在两个版本的代码之间似乎完全不同.在第一种情况下,您似乎在系统级别使用某些东西,这意味着它可能包括各种启动和最终计数的总结时间.在第二种情况下,您将测量值嵌入到实际代码中,确保仅测量周期(再次,编译器可能会消除该周期).
换句话说,您使用不一致的方法来计算可能甚至不存在的东西.您获得的结果与代码的性能几乎没有关联,或者更可能完全没有相关意义.
| 归档时间: |
|
| 查看次数: |
2015 次 |
| 最近记录: |