我将数据存储为浮点数组(单精度).我有一个数组用于我的实际数据,一个数组用于我的复杂数据,我用它作为FFT的输入.cufftComplex
如果我想使用CUDA cufft库,我需要将这些数据复制到数据类型中.来自nVidia:" cufftComplex
是一种单精度,浮点复数数据类型,由交错的实部和虚部组成." 袖带操作的数据存储在数组中cufftComplex
.
如何快速将数据从普通C数组复制到数组中cufftComplex
?我不想使用for
循环,因为它可能是最慢的选项.我不知道如何使用memcpy
这种类型的数组数据,因为我不知道它是如何存储在内存中的.谢谢!
对于GPU上的经典缩减算法,如果向量的大小是2的幂,它就能完美地工作.如果不是这样的话怎么办?在某些时候,我们将不得不找到奇数个元素的总和.处理这个问题的最佳方法是什么?