小编Toa*_*yen的帖子

有多少 CUDA 内核用于处理 CUDA 扭曲?

我正在阅读答案并且有冲突的想法:在此链接https://www.3dgep.com/cuda-thread-execution-model/ 中,两个经线(64 个线程)可以在 SM(32 个 CUDA)上同时运行核)。所以,我知道经纱上的线程被拆分并在 16 个 CUDA 核心上进行处理。这个想法对我来说很有意义,因为每个 CUDA 核心都有 1 个 32bitALU。

然而,在其他链接中,他们声称 1 个 CUDA 核心能够处理 32 个并发线程(与扭曲大小相同)(https://cvw.cac.cornell.edu/GPU/simt_warp)。因此,1 个 CUDA 扭曲只能由一个 CUDA 核心处理。这也是有道理的,因为同一经线上的所有线程都使用相同的 PC 计数器。

所以,我的问题是如何将 CUDA 扭曲与 CUDA 核心映射?

cuda nvidia core warp

1
推荐指数
1
解决办法
458
查看次数

标签 统计

core ×1

cuda ×1

nvidia ×1

warp ×1