我是 CUDA 的新手,我对内核调用感到困惑。
当您调用内核方法时,您需要指定块数和每个块的线程数,例如 kernelMethod<<< block, Threads >>>(parameters);"
那么为什么可以使用第三个参数呢?kernelMethod<<< 块,线程,???>>>(参数);
使用 cudaDeviceProp,您可以在变量 maxThreadsPerBlock 中读取每个块的线程数。但是我怎么知道最大块数呢?谢谢!!
cuda
cuda ×1