相关疑难解决方法(0)

在CUDA中转置矩阵的最有效方法是什么?

我有一个M*N主机内存矩阵,在复制到设备内存时,我需要将它转换成N*M矩阵.是否有任何cuda(cuBLAS ...)API这样做?我正在使用CUDA 4.谢谢!

cuda cublas

2
推荐指数
2
解决办法
5722
查看次数

标签 统计

cublas ×1

cuda ×1