如何从我编写的 __global__ 函数中获取 cuFunction?

ein*_*ica 1 cuda nvcc

假设我想在我编写的某些源代码上使用 CUDA 的较低级别驱动程序 API。我知道cuLaunchKernel,但我似乎无法在文档中找到如何cuFunction从函数传递给它的确切解释__global__

tal*_*ies 5

您使用cuModuleGetFunction。如果您不使用 C 链接,则传递的函数名称必须是重整的 C++ 名称。您可以在设备源的编译版本上使用 cuobjdump 来获取该信息。

  • 不,你真的不能那样做。运行时 API 使用多个内部函数和大量编译器驱动的样板文件来发挥其魔力。您实际上会发明自己的运行时 API,这似乎毫无意义。 (2认同)