小编dnb*_*ise的帖子

CUDA确定每个块的线程数,每个网格块数

我是CUDA范例的新手.我的问题是确定每个块的线程数和每个网格的块数.有点艺术和试验吗?我发现很多例子都是为这些东西选择了看似随意的数字.

我正在考虑一个问题,我可以将矩阵 - 任何大小 - 传递给乘法方法.因此,C的每个元素(如在C = A*B中)将由单个线程计算.在这种情况下,您如何确定线程/块,块/网格?

cuda nvidia dimensions matrix-multiplication

54
推荐指数
3
解决办法
6万
查看次数

CUDA和MATLAB用于循环优化

我将尝试使用CUDA优化一些用MATLAB编写的代码.我最近开始编程CUDA,但我对它是如何工作有一个大概的了解.

所以,假设我想要将两个矩阵一起添加.在CUDA中,我可以编写一种算法,利用线程计算结果矩阵中每个元素的答案.但是,这种技术可能与MATLAB的功能类似吗?在这种情况下,效率是否与技术无关并且仅归因于硬件级别?

performance matlab cuda gpgpu

5
推荐指数
1
解决办法
1457
查看次数