我从CUDA Profiler那里获得了信息.我很困惑为什么重播指令!= Grobal内存重播+本地内存重放+共享银行冲突重播?
请参阅我从profiler获得的以下信息:
Replayed Instructions(%): 81.60
Global memory replay(%): 21.80
Local memory replays(%): 0.00
Shared bank conflict replay(%): 0.00
Run Code Online (Sandbox Code Playgroud)
你能帮我解释一下吗?还有其他案例导致重播指令吗?