sca*_*man 1 cuda gpgpu
我编写了一个CUDA代码来解决NP-Complete问题,但性能并不像我怀疑的那样.
我知道"一些"优化技术(使用共享memroy,纹理,zerocopy ......)
CUDA程序员应该了解哪些最重要的优化技术?
Edr*_*ric 5
您应该阅读NVIDIA的CUDA编程最佳实践指南:http://developer.download.nvidia.com/compute/cuda/3_0/toolkit/docs/NVIDIA_CUDA_BestPracticesGuide.pdf
这有多个不同的性能提示和相关的"优先级".以下是一些重要提示:
归档时间:
15 年,3 月 前
查看次数:
1687 次
最近记录:
9 年,6 月 前