我试图通过使用CUDA来查找字符串的所有可能组合来加速我的算法.我能做到这一点的最佳方式是什么?
例:
abc
Run Code Online (Sandbox Code Playgroud)
得到:
a
b
c
ab
ac
bc
Run Code Online (Sandbox Code Playgroud)
到目前为止我什么都没有.我不是要求代码.我只想问最好的方法吗?一个算法?伪代码?也许是讨论?
我有一个节点树,我想复制到GPU memroy.Node看起来像这样:
struct Node
{
char *NodeName;
int NumberOfChildren;
Node *Children;
Node *Parent;
}
Run Code Online (Sandbox Code Playgroud)
每个节点都有一个动态数量的子节点但只有一个父节点.如何将此树复制到CUDA全局内存?我应该通过树BFS并分配/复制数据到GPU吗?或者我可以使用单个cuda内存复制指令吗?