我有很多 cuda 内核要测试,所以我希望能够通过从 python 程序执行它们来测试它们(python 程序调用启动 cuda 内核的库),即类似cuda-memcheck --leak-check full -- "python my_test_program.py". 与编写 C++ 程序执行相同操作相比,这将节省时间。这与测试 *.cc 或 *.cu 程序的内核的工作方式相同吗?
cuda-memcheck --leak-check full -- "python my_test_program.py"
python cuda nvidia
cuda ×1
nvidia ×1
python ×1