因为我很困惑,我问下面的问题......
在各种网站和论文中,我发现声明说Kepler体系结构增加了每个线程的寄存器数量,但在我的GTX680上,这似乎并不正确,因为RegsPerBlock是65536,因此对于1024个线程,它将是64个regs.我缺少什么?将来每个线程会有更多的寄存器吗?
关心丹尼尔
开普勒架构有两种变体,sm_30和sm_35.GTX 680卡基于GK104 GPU,实现了sm_30架构.该架构每个线程有64个寄存器,其中63个可用于用户代码,一个是专用零寄存器.未来基于GK110的部件如K20实现了sm_35架构,每个线程提供256个寄存器,其中255个可用于用户代码(一个也是专用的零寄存器)