小编Dan*_*Zhu的帖子

如何对CUDA SM进行扭曲计划?

正如这个问题的答案所示,当SM包含8个CUDA内核(Compute Capability 1.3)时,32个线程的单个warp需要4个时钟周期来执行整个warp的单个指令.

即,在8个核心上同时运行的经线的车道1到第8车道,然后是车道9到车道16,在车道17到车道24之后,最后是车道25到车道32.

我能正确理解吗?

所以我的问题是,在新设备上,每个SM有32个(Compute Capability 2.0)或48个(2.1)或192个(3.0,Kepler)CUDA核心,但是warp大小仍然是32.

  • 这些新SM的扭曲计划如何?
  • 车道1到车道32是否一起运行,或者像上面提到的车道1到车道8,车道9到车道16,......在旧的CUDA SM上?

cuda

5
推荐指数
1
解决办法
951
查看次数

标签 统计

cuda ×1