CUDA和课程

Question

我一直在搜索有关如何使用CUDA的类的一些见解,虽然人们普遍认为它可以完成并且显然是由人完成,但我很难找到实际的方法.做到这一点.

我有一个类,它通过运算符重载等实现基本的bitset.我需要能够在主机和设备上实例化此类的对象,在两者之间进行复制等.我是否在.cu中定义了这个类？如果是这样,我如何在我的主机端C++代码中使用它？该类的函数不需要访问特殊的CUDA变量,如threadId; 它只需要能够用于主机和设备端.

感谢您的帮助,如果我以完全错误的方式接近这一点,我很想听听替代方案.

Answer 1

在#include的头文件中定义类,就像在C++中一样.

必须从设备代码调用的任何方法都应使用__device__和__host__declspecs 定义,包括构造函数和析构函数(如果您计划在设备上使用new/)delete(注意new/ delete需要CUDA 4.0和计算能力2.0或更高的GPU).

您可能想要定义一个宏

#ifdef __CUDACC__
#define CUDA_CALLABLE_MEMBER __host__ __device__
#else
#define CUDA_CALLABLE_MEMBER
#endif

然后在您的成员函数上使用此宏

class Foo {
public:
    CUDA_CALLABLE_MEMBER Foo() {}
    CUDA_CALLABLE_MEMBER ~Foo() {}
    CUDA_CALLABLE_MEMBER void aMethod() {}
};

原因是只有CUDA编译器知道__device__并且__host__- 您的主机C++编译器会引发错误.

编辑:注意__CUDACC__由NVCC在编译CUDA文件时定义.这可以在使用NVCC编译.cu文件时,也可以在使用命令行选项编译任何文件时使用-x cu.