Ubuntu 版本 20.04 LTS
NVIDIA驱动以及cuda等相关包均已正确安装。运行 nvidia-smi 和 cuda 代码正常。
Docker 相关的 NVIDIA 软件包也已安装(NVIDIA Container Toolkit)。最初的问题是,如果我尝试在 docker 中验证 NVIDIA 支持,则会收到以下错误消息:
$ sudo docker run --gpus all nvidia/cuda:10.0-base nvidia-smi
docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].
Run Code Online (Sandbox Code Playgroud)
在找到一些在线讨论后,我尝试按照此处的说明重新安装 docker: https: //docs.docker.com/engine/install/ubuntu/ 它对我有用。NVIDIA 现在在 docker 下工作。
但是,重新启动后,它将停止工作。我将不得不做类似的事情:
$ sudo apt-get reinstall docker-ce docker-ce-cli containerd.io
Run Code Online (Sandbox Code Playgroud)
让 NVIDIA 再次在 docker 下工作。可以确认每次重新启动都会导致此问题。
如何让它工作,这样我就不必每次重新启动后都重新安装?