目前,我开发了一个基于GPU的程序,该程序使用多个内核,这些内核通过使用多个流同时启动.
在我的应用程序中,多个内核需要访问队列/堆栈,我计划使用原子操作.
但我不知道原子操作是否在多个内核同时启动之间起作用.请帮助我了解GPU上的原子操作的确切机制或有此问题经验的人.
concurrency cuda gpu-atomics
concurrency ×1
cuda ×1
gpu-atomics ×1