剖析cublas应用程序

And*_*rew 4 c profiling cuda nvidia cublas

我正在尝试配置我的应用程序,该应用程序在Windows上专门使用cuBLAS和Nvidia Visual Profiler,但它表明我的应用程序中根本没有GPU使用!也就是说,除了分析开销之外,时间线是完全空的.为了确保某人没有更改安全设置或我下面的内容,我使用内核和cudaMemcpy调用来分析应用程序,并对其进行了正确的分析.是什么赋予了?我错过了一个设置吗?链接到错误版本的cuBLAS库?或者它实际上并没有调用GPU(虽然对我来说似乎完全不可能......)?我正在使用英特尔的编译器进行64位支持,如果这有所不同的话.

谢谢!

And*_*rew 5

对于任何人谁在将来这个问题上运行:我不得不使用cudaProfilerStart()cudaProfilerStop()在我的CUBLAS功能.只是添加cudaDeviceSyncrhonize()没有解决问题.