我想测量GPU的时间内核,如何在NVIDIA CUDA中测量它?例如
__global__ void kernelSample()
{
some code here
get start time
some code here
get stop time
some code here
}
Run Code Online (Sandbox Code Playgroud) 我有一个CUDA内核,可以调用一系列设备函数.
获取每个设备功能的最佳方法是什么?
在其中一个设备功能中获取代码段执行时间的最佳方法是什么?