小编hhe*_*eth的帖子

Cuda虚拟课

我想在cuda内核中执行一些虚拟方法,但是我不想在同一个内核中创建对象,而是想在主机上创建它并将其复制到gpu内存中.

我在内核中成功创建对象并调用虚方法.复制对象时出现问题.这是有道理的,因为显然虚函数指针是假的.发生的事情只是"Cuda网格发射失败",至少这是Nsight所说的.但是当看到SASS时,它会在虚拟函数指针的解除引用时崩溃,这是有道理的.

我当然使用Cuda 4.2以及在拟合卡上使用"compute_30"进行编译.

那么推荐的方式是什么?或者这个功能根本不受支持?

我有想法首先运行一个不同的内核,它创建虚拟对象并提取虚拟函数指针,以便在复制之前"修补"我的对象.可悲的是,这并没有真正发挥作用(还没有想到它)以及它将是一个丑陋的解决方案.

PS这实际上是这个问题的重演,遗憾的是从来没有完全回答过.

编辑:

所以我找到了一种方法来做我想做的事.但是要明确一点:这根本不是一个答案或解决方案,答案已经提供,这只是一个黑客,只是为了好玩.

首先让我们看看Cuda在调用虚拟方法时正在做什么,下面是调试SASS

//R0 is the address of our object
LD.CG R0, [R0];  
IADD R0, R0, 0x4;  
NOP;  
MOV R0, R0;  
LD.CG R0, [R0];
...
IADD R0, RZ, R9;  
MOV R0, R0;  
LDC R0, c[0x2][R0];
...
BRX R0 - 0x5478
Run Code Online (Sandbox Code Playgroud)

因此,假设"c [0x2] [INDEX]"对于所有内核都是常量,我们可以通过运行内核并执行此操作来获取类的索引,其中obj是类的新创建的对象,其中:

unsigned int index = *(unsigned int*)(*(unsigned int*)obj + 4);
Run Code Online (Sandbox Code Playgroud)

然后使用这样的东西:

struct entry
{
    unsigned int vfptr;// := &vfref, thats our value to store in an object
    int dummy;// …
Run Code Online (Sandbox Code Playgroud)

c++ cuda virtual-functions

5
推荐指数
1
解决办法
2856
查看次数

标签 统计

c++ ×1

cuda ×1

virtual-functions ×1