如何测量cpu时间和挂钟时间？

Question

如何测量cpu时间和挂钟时间？

我看到很多关于此的主题,甚至在stackoverflow上,例如:

我想测量cpu和wall时间.虽然在我发布的主题中回答问题的人建议使用gettimeofday测量墙壁时间,但我读到它更好用clock_gettime.所以,我写了下面的代码(它没关系,它真的测量了一个时间,而不是cpu时间吗？我问,因为我找到了一个网页:http://nadeausoftware.com/articles/2012/03/c_c_tip_how_measure_cpu_time_benchmarking#clockgettme它说clock_gettime测量cpu时间...)什么是真相,我应该使用哪一个来衡量一个时间？

另一个问题是关于cpu时间.我找到了clock很好的答案,所以我也为它写了一个示例代码.但它不是我真正想要的,因为我的代码它显示了0秒的CPU时间.是否可以更准确地测量cpu时间(以秒为单位)？感谢您的帮助(目前我只对Linux解决方案感兴趣).

继承我的代码:

#include <time.h>
#include <stdio.h>      /* printf */
#include <math.h>       /* sqrt */
#include <stdlib.h>

int main()
{
    int i;
    double sum;

    // measure elapsed wall time
    struct timespec now, tmstart;
    clock_gettime(CLOCK_REALTIME, &tmstart);
    for(i=0; i<1024; i++){
        sum += log((double)i);
    }
    clock_gettime(CLOCK_REALTIME, &now);
    double seconds = (double)((now.tv_sec+now.tv_nsec*1e-9) - (double)(tmstart.tv_sec+tmstart.tv_nsec*1e-9));
    printf("wall time %fs\n", seconds);

    // measure cpu time
    double start = (double)clock() /(double) CLOCKS_PER_SEC;
    for(i=0; i<1024; i++){
        sum += log((double)i);
    }
    double end = (double)clock() / (double) CLOCKS_PER_SEC;
    printf("cpu time %fs\n", end - start);

    return 0;
}

Run Code Online (Sandbox Code Playgroud)

像这样编译它:

gcc test.c -o test -lrt -lm

它告诉我:

wall time 0.000424s
cpu time 0.000000s

Run Code Online (Sandbox Code Playgroud)

我知道我可以做更多的迭代,但这不是重点;)

重要:

printf("CLOCKS_PER_SEC is %ld\n", CLOCKS_PER_SEC);

Run Code Online (Sandbox Code Playgroud)

节目

CLOCKS_PER_SEC is 1000000

Run Code Online (Sandbox Code Playgroud)

Answer 1

Bry*_*ier 6

根据我的手册页面clock说

POSIX要求CLOCKS_PER_SEC等于1000000,与实际分辨率无关.

当增加计算机上的迭代次数时,测量的cpu-time开始显示在100000次迭代上.从返回的数字看,分辨率实际上是10毫秒.

请注意,当您优化代码时,整个循环可能会消失,因为它sum是一个死值.也没有什么可以阻止编译器clock在循环中移动语句,因为它们之间没有真正的依赖关系.

让我详细说明代码性能的微观测量.测量性能的天真和诱人的方法确实是通过添加clock语句来完成的.但是,由于时间不是C中的概念或副作用,编译器通常可以随意移动这些clock调用.为了解决这个问题,很容易让这些clock调用产生副作用,例如让它具有访问volatile变量.但是,这仍然不会禁止编译器通过调用移动高度无副作用的代码.想想访问常规局部变量的例子.但更糟糕的是,通过使clock调用对编译器看起来非常可怕,您实际上会对任何优化产生负面影响.因此,仅仅测量性能会以负面和不合需要的方式影响性能.

如果您使用分析,正如某人已经提到的那样,您可以对优化代码的性能进行非常好的评估,尽管总体时间当然会增加.

测量性能的另一个好方法是让编译器报告一些代码将采用的周期数.对于许多体系结构,编译器对此有非常准确的估计.然而,最值得注意的是奔腾架构并不是因为硬件做了很多很难预测的调度.

虽然这不是常规做法,但我认为编译器应该支持pragma标记要测量的功能.然后,编译器可以在函数的序言和结尾中包括高精度非侵入式测量点,并禁止任何内联函数.根据架构,它可以选择高精度时钟来测量时间,最好是在OS的支持下,仅测量当前过程的时间.

归档时间：	12 年，4 月前
查看次数：	18791 次
最近记录：	12 年，4 月前