nvidia-container-cli:初始化错误:cuda错误:没有检测到具有cuda功能的设备

Tha*_*ndu 7 docker nvidia-docker

我正在使用nvidia/cuda:8.0-devel图像并尝试运行它.但是我收到以下错误.

sudaraka@RnDCompute:~$ docker run -it --runtime=nvidia nvidia/cuda:8.0-devel docker: Error response from daemon: oci runtime error: container_linux.go:265: starting container process caused "process_linux.go:368: container init caused \"process_linux.go:351: running prestart hook 1 caused \\\"error running hook: exit status 1, stdout: , stderr: exec command: [/usr/bin/nvidia-container-cli --load-kmods configure --ldconfig=@/sbin/ldconfig.real --device=all --compute --utility --require=cuda>=8.0 --pid=12053 /var/lib/docker/overlay2/a72cba41e94578ff91c71ab56b07d8e9153386e43383482ac649419ae0a77220/merged]\\\\nnvidia-container-cli: initialization error: cuda error: no cuda-capable device is detected\\\\n\\\"\"".
Run Code Online (Sandbox Code Playgroud)

它说没有检测到具有cuda功能的设备.我安装了cuda 8.0.

sudaraka@RnDCompute:~$ nvcc --version nvcc: NVIDIA (R) Cuda compiler driver Copyright (c) 2005-2016 NVIDIA Corporation Built on Mon_Jan_23_12:24:11_CST_2017 Cuda compilation tools, release 8.0, V8.0.62
Run Code Online (Sandbox Code Playgroud)

以及司机.

sudaraka@RnDCompute:~$ cat /proc/driver/nvidia/version NVRM version: NVIDIA UNIX x86_64 Kernel Module 384.98 Thu Oct 26 15:16:01 PDT 2017 GCC version: gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.4)
Run Code Online (Sandbox Code Playgroud)

我的码头版本是17.09.0-ce.由于没有检测到具有cuda功能的设备,我得到的错误可能是什么问题?

谢谢

小智 0

可能是安装没成功,能显示一下nvidia-smi的结果吗?,您应该尝试以单独的模式安装 cuda 和 nvidia-driver,如下所示:

cuda 9.2 和 nvidia 驱动程序 396

CUDA

这里有几个问题,不要在下面:

  • 安装 NVIDIA 加速显卡驱动程序 (N)
  • 您想安装 OpenGL 库吗?(N)
  • 您想运行 nvidia-xconfig 吗?(N)

英伟达

  • sudo add-apt-repository ppa:显卡驱动程序/ppa
  • 须藤apt更新
  • sudo apt install nvidia-396

安装cuda后,它将位于/usr/local/cuda中,并使用nvidia-smi测试nvidia驱动程序

安装dockernvidia-docker,并进行测试:

  • docker run -it --runtime=nvidia nvidia/cuda:8.0-devel

    或者

  • nvidia-docker run -it --runtime=nvidia nvidia/cuda:8.0-devel

我希望它有用,请告诉我!