错误:在EC2 g2.2xlarge上安装Cuda后无法插入'nvidia_352'

Lia*_*Dai 9 cuda amazon-ec2

启动Ubuntu Server 14.04 LTS(HVM)后,我尝试按如下方式安装CUDA

wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1404/x86_64/cuda-repo-ubuntu1404_7.5-18_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1404_7.5-18_amd64.deb
sudo apt-get update
sudo apt-get install -y cuda
export PATH=/usr/local/cuda-7.5/bin:$PATH 
export LD_LIBRARY_PATH=/usr/local/cuda-7.5/lib64:$LD_LIBRARY_PATH
sudo reboot
Run Code Online (Sandbox Code Playgroud)

然后我进行了测试

cuda-install-samples-7.5.sh .
cd ~/NVIDIA_CUDA-7.5_Samples/1_Utilities/deviceQuery 
make  
./deviceQuery
Run Code Online (Sandbox Code Playgroud)

得到了错误:

modprobe:错误:无法插入'nvidia_352':模块中的未知符号或未知参数(请参阅dmesg)cudaGetDeviceCount返回38 - >未检测到支持CUDA的设备

这可能有什么问题?

Phi*_*ipz 10

在安装nvidia-driver之前升级Ubuntu并安装linux-image-extra sudo apt-get update && sudo apt-get -y upgrade sudo apt-get install -y linux-image-extra-`uname -r`


tal*_*ies 2

这似乎是AWS GPU 实例上 CUDA 7.5 中的一个已知问题。短期解决办法似乎是暂时降级到 CUDA 7。


于 2015 年 12 月编辑,添加来自 NVIDIA 的 Robert Crovella 建议 EC2 g2.2xlarge 上的 CUDA 7.5 现在应该可以与 352.63 或更高版本的驱动程序一起使用。因此,驱动程序更新应该可以解决该问题。

[这个答案是根据评论汇总的,并添加为社区维基条目,以使这个问题从未回答的列表中删除]