我目前正在研究CUDA,了解到有全局内存和共享内存。
我查看了CUDA文档,发现GPU可以分别使用ld.shared/st.shared和ld.global/st.global指令访问共享内存和全局内存。
我好奇的是用什么指令将数据从全局内存加载到共享内存?
如果有人能让我知道那就太好了。
谢谢!
__global__ void my_function(int* global_mem)
{
__shared__ int shared_mem[10];
for(int i = 0; i < 10; i++) {
shared_mem[i] = global_mem[i]; // What instrcuton is used for this load operation?
}
}
Run Code Online (Sandbox Code Playgroud)