CUDA:注入我自己的PTX功能?

sho*_*osh 4 cuda gpu

我希望能够使用PTX 1.3中尚未实现C接口的功能.有没有办法在PTX中编写自己的函数并注入现有的二进制文件?

我正在寻找的功能是获得的价值 %smid

sho*_*osh 6

答案:

__noinline__ __device__ uint get_smid(void)
{
    uint ret;
    asm("mov.u32 %0, %smid;" : "=r"(ret) );
    return ret;
}
Run Code Online (Sandbox Code Playgroud)