我有一个cuda代码,我已经实现了几个C2C 2D FFT.它们都使用相同的计划,但由于某种原因,2D FFT的时间很长,而且似乎变化很大.相同的数据大小FFT似乎需要0.4s到1.8s
这适用于1920x1080 FFT.那些时候看起来合理吗?
无论如何 - 我对CUDA 1-D批量FFT的快速体验有很好的经验.在行中采用一维FFT是否相同,然后在矩阵的列上再次得到与此二维FFT相同的结果?对于1D FFT之前的数据集,我经历过几秒钟内发生的FFT,因此我希望能够修复其中的一些结果.
谢谢
归档时间: |
|
查看次数: |
2217 次 |
最近记录: |