小编use*_*464的帖子

CUDA如何在一个内核函数中启动新的内核调用?

我是CUDA编程新手.现在,我有一个问题要处理:我正在尝试使用CUDA并行编程来处理一组数据集.对于每个数据集,都需要进行一些矩阵计算.

我的设计是这样的:

  1. 启动N个线程来处理每个数据集,因为它们彼此独立,处理它们的方法是相同的.

  2. 在1中的每个线程中,我想使用一个新函数,这个函数也像内核一样工作,因为它们是矩阵计算...例如调用M个线程来并行处理矩阵计算.

有谁知道它是否可能?

cuda

3
推荐指数
1
解决办法
7796
查看次数

标签 统计

cuda ×1