fhu*_*cho 5 parallel-processing cuda gpgpu opencl depth-first-search
我已经在MPI中实现并行深度优先搜索算法了一半,我正在考虑尝试在CUDA/OpenCL中进行,只是为了好玩/出于好奇.算法很简单,但并不简单.C中的单核版本大约有200行代码.
GPGPU适合这种问题多少钱?
树搜索操作不是那么容易在CUDA中实现.有一些论文,比如一篇
另一个相当简单的实现(在我看来,并不是一个大规模并行化的实现)
困难来自这样的事实:树操作通常涉及决策,并且根据决策,采取不同的分支.因此,大规模并行化操作而不重叠并进行冗余操作非常困难.
有一些方法使用堆栈和队列实现来遍历树.
您可能会在此处找到类似的问题: 错误:CUDA同步上的BFS