mku*_*use 15 docker nvidia-docker
安装 docker-ce 后,我尝试安装 nvidia-docker。我按照这个:https : //github.com/NVIDIA/nvidia-docker安装 nvidia-docker。它似乎已正确安装。
我试着跑:
$ sudo docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi
docker: Error response from daemon: Unknown runtime specified nvidia.
See 'docker run --help'.
Run Code Online (Sandbox Code Playgroud)
虽然,这有效(没有 --runtime=nvidia):
$ docker container run -ti ubuntu bash
Run Code Online (Sandbox Code Playgroud)
我的系统上的一些附加信息:它是一个带有 8 个 GPU(Titan Xp)和 nvidia 驱动程序版本 387.26 的 ubuntu 服务器 16.04。我可以在主机系统上运行 nvidia-smi -l 1 并且它按预期工作。
$ dpkg -l | grep -E '(nvidia|docker)'
ii docker-ce 18.06.1~ce~3-0~ubuntu amd64 Docker: the open-source application container engine
ii libnvidia-container-tools 1.0.0-1 amd64 NVIDIA container runtime library (command-line tools)
ii libnvidia-container1:amd64 1.0.0-1 amd64 NVIDIA container runtime library
ii nvidia-container-runtime 2.0.0+docker18.06.1-1 amd64 NVIDIA container runtime
ii nvidia-container-runtime-hook 1.4.0-1 amd64 NVIDIA container runtime hook
ii nvidia-docker2 2.0.3+docker18.06.1-1 all nvidia-docker CLI wrapper
$ cat /etc/docker/daemon.json
{
"runtimes": {
"nvidia": {
"path": "nvidia-container-runtime",
"runtimeArgs": []
}
}
}
Run Code Online (Sandbox Code Playgroud)
我遇到过:https : //github.com/NVIDIA/nvidia-docker/issues/501,但我不确定我应该如何去做。
小智 9
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update
sudo apt-get install -y nvidia-docker2
sudo pkill -SIGHUP dockerd
Run Code Online (Sandbox Code Playgroud)
小智 5
实际上,您可以尝试通过以下命令重新启动 docker daemon。
sudo systemctl daemon-reload
sudo systemctl restart docker
Run Code Online (Sandbox Code Playgroud)
或者您可以尝试重新启动系统。使 nvidia-docker 工作
这就是我在 CentOS 7 上解决上述问题的方法;希望它可以帮助任何有类似问题的人。
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-container-runtime/$distribution/nvidia-container-runtime.repo | sudo tee /etc/yum.repos.d/nvidia-container-runtime.repo
Run Code Online (Sandbox Code Playgroud)
sudo yum-config-manager --disable libnvidia-container-experimental
sudo yum-config-manager --disable nvidia-container-runtime-experimental
Run Code Online (Sandbox Code Playgroud)
sudo yum install nvidia-container-runtime
Run Code Online (Sandbox Code Playgroud)
sudo vim /etc/docker/daemon.json
Run Code Online (Sandbox Code Playgroud)
以及 nvidia-container-runtime 的路径:
{
"runtimes": {
"nvidia": {
"path": "/usr/bin/nvidia-container-runtime",
"runtimeArgs": []
}
}
}
Run Code Online (Sandbox Code Playgroud)
sudo pkill -SIGHUP dockerd
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
20895 次 |
| 最近记录: |