小编nnm*_*ner的帖子

cuSPARSE 和 cuBLAS 库如何处理使用 cudaMallocPitch 分配的内存?

我正在实现一个简单的例程,使用 cuSPARSE 的 cusparseScsrmm 执行稀疏矩阵-密集矩阵乘法。这是一个更大的应用程序的一部分,可以使用 cudaMalloc(超过 99% 的时间)或 cudaMallocPitch(很少使用)在 GPU 上分配内存。我有几个关于 cuSPARSE 如何处理倾斜记忆的问题:

1)我将音调内存传递到 cuSPARSE 例程中,但结果不正确(如预期,因为无法将音调作为参数传递)。有没有办法让这些库使用使用 cudaMallocPitch 分配的内存?

2)处理这个问题的最佳方法是什么?我是否应该在调用函数中添加一个检查,以强制不使用倾斜模式分配内存?

memory cuda sparse-matrix

4
推荐指数
1
解决办法
596
查看次数

标签 统计

cuda ×1

memory ×1

sparse-matrix ×1