sho*_*osh 4 cuda gpu
我希望能够使用PTX 1.3中尚未实现C接口的功能.有没有办法在PTX中编写自己的函数并注入现有的二进制文件?
我正在寻找的功能是获得的价值 %smid
%smid
sho*_*osh 6
答案:
__noinline__ __device__ uint get_smid(void) { uint ret; asm("mov.u32 %0, %smid;" : "=r"(ret) ); return ret; }
归档时间:
15 年,4 月 前
查看次数:
528 次
最近记录:
12 年,8 月 前