小编use*_*472的帖子

CUDA中的高性能前缀和/扫描功能,寻找推力,cuDPP库的替代品

我正在为CUDA中的项目寻找高性能多扫描/多前缀和(一个内核执行中的许多行)函数.

我尝试过Thrust库中的那个但是它太慢了.使用nvcc调试标志(-g -G)编译后也会导致崩溃.

在我与Thrust失败之后,我专注于cuDPP库,它曾经是CUDA工具包的一部分.cuDPP性能非常好但是库没有最新的cuda 5.5,并且在使用内存检查器进行调试时,cudppMultiScan()函数中存在一些全局内存冲突问题.(cuda 5.5,nsight 3.1,visual studio 2010,gtx 260 cc 1.3)

有没有人知道使用什么而不是这两个库?

R.

cuda thrust cudpp

5
推荐指数
1
解决办法
4288
查看次数

标签 统计

cuda ×1

cudpp ×1

thrust ×1