Chr*_*ley 3 algorithm performance cuda cpu-architecture
我已经处理了许多数据匹配问题,并且经常可以快速并行地运行许多CPU密集型算法的实现,例如汉明/编辑距离.这是CUDA有用的东西吗?
您解决了哪些类型的数据处理问题?标准的四核英特尔台式机是否真的有所提升?
克里斯
bas*_*ero 5
我想你已经回答了自己的问题.通常,CUDA/OpenCL可以加速大规模并行操作.我们使用CUDA执行各种DSP操作(FFT,FIR)并看到了数量级的加速.几百美元的数量级加速是一次抢断.虽然像MKL和OpenMP这样的专用CPU库给我们提高了速度,但CUDA/OpenCL要快得多.
点击此处查看CUDA使用示例
归档时间:
15 年,7 月 前
查看次数:
1863 次
最近记录:
14 年,11 月 前