6 c algorithm performance time measurement
这是"算法",但是当我想测量执行时间时,它给我零.为什么?
#define ARRAY_SIZE 10000
...
clock_t start, end;
start = clock();
for( i = 0; i < ARRAY_SIZE; i++)
{
non_parallel[i] = vec[i] * vec[i];
}
end = clock();
printf( "Number of seconds: %f\n", (end-start)/(double)CLOCKS_PER_SEC );
Run Code Online (Sandbox Code Playgroud)
那么我该怎么做来衡量时间呢?
Mys*_*ial 14
两件事情:
10000在现代计算机上并不是很多.因此,该循环的运行时间可能不到一毫秒 - 小于精度clock().因此它将返回零.
如果您没有使用non_parallel可能的结果,整个循环将由编译器优化.
最有可能的是,你只需要一个更昂贵的循环.尝试增加到ARRAY_SIZE更大的东西.
这是我的机器上有一个更大阵列尺寸的测试:
#define ARRAY_SIZE 100000000
int main(){
clock_t start, end;
double *non_parallel = (double*)malloc(ARRAY_SIZE * sizeof(double));
double *vec = (double*)malloc(ARRAY_SIZE * sizeof(double));
start = clock();
for(int i = 0; i < ARRAY_SIZE; i++)
{
non_parallel[i] = vec[i] * vec[i];
}
end = clock();
printf( "Number of seconds: %f\n", (end-start)/(double)CLOCKS_PER_SEC );
free(non_parallel);
free(vec);
return 0;
}
Run Code Online (Sandbox Code Playgroud)
输出:
Number of seconds: 0.446000
Run Code Online (Sandbox Code Playgroud)
这是一种实际计算秒数的不可靠方法,因为该clock()函数的精度非常低,并且您的循环没有做很多工作.您可以使循环执行更多操作以使其运行更长时间,或使用更好的计时方法.
更高精度的方法是特定于平台的.对于Windows,请参阅如何使用QueryPerformanceCounter?对于Linux,请参阅使用C++和Linux的高分辨率计时器?