是否可以通过新CUDA6中的简单指针从CPU-Cores访问GPU-RAM？

Question

是否可以通过新CUDA6中的简单指针从CPU-Cores访问GPU-RAM？

Ale*_*lex 1 cuda gpgpu nvidia virtual-address-space

现在,如果我使用此代码尝试在GeForce GTX460SE(CC2.1)中使用CUDA5.5从CPU-Cores访问GPU-RAM,那么我会收到异常"访问冲突":

#include "cuda_runtime.h"
#include "device_launch_parameters.h"

#include <iostream>

int main()
{
    unsigned char* gpu_ptr = NULL;
    cudaMalloc((void **)&gpu_ptr, 1024*1024);

    *gpu_ptr = 1;

    int q; std::cin >> q;
    return 0;
}

Run Code Online (Sandbox Code Playgroud)

但我们知道,有UVA(统一虚拟寻址).还有一些新的:

2013年10月25日 - 331.17 Beta Linux GPU驱动程序:新的NVIDIA统一内核内存模块是即将发布的NVIDIA CUDA公开的统一内存功能的新内核模块.新模块是nvidia-uvm.ko,它将允许GPU和系统RAM之间的统一内存空间.http://www.phoronix.com/scan.php?page=news_item&px=MTQ5NDc
CUDA 6的主要功能包括:统一内存 - 通过使应用程序能够访问CPU和GPU内存而无需手动将数据从一个复制到另一个来简化编程,并且可以更轻松地在各种范围内添加对GPU加速的支持编程语言.http://www.techpowerup.com/194505/nvidia-dramatically-simplifies-parallel-programming-with-cuda-6.html

是否可以通过使用新CUDA6中的简单指针从CPU-Cores访问内存GPU-RAM？

Answer 1

Rob*_*lla 8

是的,unified memoryCUDA 6中的新功能将使Kepler设备及其他设备(以及您的Fermi GPU上没有)能够共享主机和设备代码之间的指针.

为了实现这一目标,您需要使用Kepler设备(如cc 3.0或3.5)和新cudaMallocManagedAPI.当CUDA 6.0正式发布时,这将进一步记录,但与此同时,您可以在此博客上阅读更多相关信息,其中包括示例.

这种机制不会神奇地导致PCI Express总线的影响消失,因此实际上发生的事情是两个数据副本正在"幕后"制作,并且cudaMemcpy操作由cuda运行时根据需要自动调度.有许多其他实现问题需要注意,现在我建议阅读博客.

请注意,统一内存(UM)与统一虚拟寻址(UVA)不同,后者自CUDA 4.0开始提供并已记录.

归档时间：	12 年前
查看次数：	2511 次
最近记录：	12 年前