CUDA和MATLAB用于循环优化

dnb*_*ise 5 performance matlab cuda gpgpu

我将尝试使用CUDA优化一些用MATLAB编写的代码.我最近开始编程CUDA,但我对它是如何工作有一个大概的了解.

所以,假设我想要将两个矩阵一起添加.在CUDA中,我可以编写一种算法,利用线程计算结果矩阵中每个元素的答案.但是,这种技术可能与MATLAB的功能类似吗?在这种情况下,效率是否与技术无关并且仅归因于硬件级别?

Jos*_*ega 3

该技术可能类似,但请记住,对于 CUDA,您有数百个线程同时运行。如果 MATLAB 使用线程并且这些线程在四核上运行,则每个时钟周期只能执行 4 个线程,而在同一时钟周期内可能会在 CUDA 上运行数百个线程。

所以回答你的问题,是的,这个例子中的效率与技术无关,仅归因于硬件。