在CUDA中,给定指针的值或变量的地址,是否存在内部或另一个API,它将内省指针指向的地址空间?
cuda
我正在尝试测量GPU上的峰值单精度触发器,因为我正在修改PTX文件以在寄存器上执行连续的MAD指令.不幸的是,编译器正在删除所有代码,因为它实际上没有任何用处,因为我不执行任何数据的加载/存储.是否有编译器标志或编译指示添加到代码中,因此编译器不会触及它?
谢谢.
optimization cuda gpu nvcc
cuda ×2
gpu ×1
nvcc ×1
optimization ×1