CUDA驱动程序API提供从文件系统加载包含PTX代码的文件.通常会做以下事情:
CUmodule module;
CUfunction function;
const char* module_file = "my_prg.ptx";
const char* kernel_name = "vector_add";
err = cuModuleLoad(&module, module_file);
err = cuModuleGetFunction(&function, module, kernel_name);
Run Code Online (Sandbox Code Playgroud)
如果在运行时(运行中)生成PTX文件,则通过文件IO似乎是浪费(因为驱动程序必须再次加载它).
有没有办法直接将PTX程序传递给CUDA驱动程序(例如作为C字符串)?