我正在使用CUDA 5.0和Compute Capability 2.1卡.
问题非常简单:内核可以成为类的一部分吗?例如:
class Foo
{
private:
//...
public:
__global__ void kernel();
};
__global__ void Foo::kernel()
{
//implementation here
}
Run Code Online (Sandbox Code Playgroud)
如果没有,那么解决方案是创建一个包装函数,该函数是类的成员并在内部调用内核?
如果是,那么它是否可以作为普通私有函数访问私有属性?
(我不只是尝试它,看看会发生什么,因为我的项目现在有其他几个错误,而且我认为这是一个很好的参考问题.我很难找到使用C++与C++的参考.基本功能的例子可以是找到但不是结构化代码的策略.)
让我暂时不讨论 cuda 动态并行性(即假设计算能力为 3.0 或更早版本)。
请记住 __ global__ 用于将(仅)从主机调用(但在设备上执行)的 cuda 函数。如果您在设备上实例化该对象,它将无法工作。此外,为了使设备可访问的私有数据可供成员函数使用,必须在设备上实例化该对象。
因此,您可以进行内核调用(即mykernel<<<blocks,threads>>>(...);
嵌入到主机对象成员函数中),但内核定义(即带有 __ global__ 装饰器的函数定义)通常会位于源代码中的对象定义之前。如上所述,这样方法不能用于在设备上实例化的对象。它也无法访问对象中其他地方定义的普通私有数据。(也许可以为仅主机对象提出一个方案,该方案确实创建了设备数据,使用全局内存中的指针,然后可以在设备上访问这些数据,但乍一看,这样的方案对我来说似乎相当复杂)。
通常,设备可用的成员函数前面会带有 __ device__ 装饰器。在这种情况下,设备成员函数中的所有代码都从调用它的线程内执行。
这个问题给出了一个 C++ 对象的示例(在我编辑的答案中),该对象具有可从主机和设备调用的成员函数,并在主机和设备对象之间进行适当的数据复制。
归档时间: |
|
查看次数: |
11214 次 |
最近记录: |