我刚学会了(为什么只有一个warp由cuda中的SM执行?)Kepler GPU实际上可以同时执行几个(显然是4个)warp的指令.
共享内存库是否也可以同时提供四个请求?如果不是这样,那就意味着银行冲突可能发生在碰巧同时执行的不同warp的线程之间,即使在任何单个warp中没有银行冲突,对吧?有没有关于此的信息?
cuda shared-memory bank-conflict
bank-conflict ×1
cuda ×1
shared-memory ×1