同一个多处理器上的并发唯一内核?

Jor*_*dan 1 concurrency cuda kepler cuda-streams

是否有可能使用流在Kepler 3.5 GPU中的同一流多处理器上拥有多个独特的内核?即<<<1,1024>>>在具有15个SM的Kepler GPU上同时运行30个大小的内核?

tal*_*ies 6

在计算能力3.5设备上,它可能是可能的.

这些设备支持每个GPU最多32个并发内核和2048个线程对等多处理器.每个多处理器有64k个寄存器,如果每个线程的寄存器占用空间少于16个,每个块的共享内存少于24kb,则两个1024个线程的块可以同时运行.

您可以找到所有这些是CUDA编程指南附录中的硬件描述.

  • Slide 19 [here](http://on-demand.gputechconf.com/gtc/2013/presentations/S3466-Programming-Guidelines-GPU-Architecture.pdf)也可能是有意义的. (2认同)