我搜索了很多地方,但我得到的是如何安装它,而不是如何验证它是否已安装.我可以验证我的NVIDIA驱动程序已安装,并且已安装CUDA,但我不知道如何验证是否已安装CuDNN.非常感谢帮助,谢谢!
PS.
这是为了实现caffe.目前一切正常,没有启用CuDNN.
为了调试CUDA代码和检查兼容性,我需要找出我安装的GPU的nvidia驱动程序版本.我找到了如何获得cuda版本?但这对我没有帮助.
我对运行which nvcc和显示的不同CUDA版本感到非常困惑nvidia-smi.
我的ubuntu 16.04上安装了cuda9.2和cuda10.现在我将PATH设置为指向cuda9.2.所以当我跑:
$ which nvcc
/usr/local/cuda-9.2/bin/nvcc
Run Code Online (Sandbox Code Playgroud)
但是,当我跑
$ nvidia-smi
Wed Nov 21 19:41:32 2018
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.72 Driver Version: 410.72 CUDA Version: 10.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 106... Off | 00000000:01:00.0 Off | N/A |
| N/A 53C P0 26W / N/A | 379MiB / 6078MiB | 2% …Run Code Online (Sandbox Code Playgroud) 我在Ubuntu 15.10上运行TensorFlow.当我进入时pip show tensorflow,我看到TF已正确安装.
但是,当我写import tensorflow as tf,我收到以下错误消息:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/home/me/anaconda2/lib/python2.7/site-packages/tensorflow/__init__.py", line 23, in <module>
from tensorflow.python import *
File "/home/me/anaconda2/lib/python2.7/site-packages/tensorflow/python/__init__.py", line 49, in <module>
from tensorflow import contrib
File "/home/me/anaconda2/lib/python2.7/site-packages/tensorflow/contrib/__init__.py", line 23, in <module>
from tensorflow.contrib import layers
File "/home/me/anaconda2/lib/python2.7/site-packages/tensorflow/contrib/layers/__init__.py", line 68, in <module>
from tensorflow.contrib.layers.python.layers import *
File "/home/me/anaconda2/lib/python2.7/site-packages/tensorflow/contrib/layers/python/layers/__init__.py", line 22, in <module>
from tensorflow.contrib.layers.python.layers.initializers import *
File "/home/me/anaconda2/lib/python2.7/site-packages/tensorflow/contrib/layers/python/layers/initializers.py", line 24, in <module>
from …Run Code Online (Sandbox Code Playgroud) 我正在使用 anaconda 来调节我的环境,对于一个项目,我必须使用 GPU 进行网络训练。我在我的项目中使用 pytorch,并且正在尝试让 CUDA 工作。
我安装了cudatoolkit、numba、cudnn
不过,当我尝试这个命令时:
torch.cuda.is_available()
Run Code Online (Sandbox Code Playgroud)
我得到“False”作为输出。这是我的环境:
# Name Version Build Channel
blas 1.0 mkl
bzip2 1.0.6 h470a237_2 conda-forge
ca-certificates 2018.03.07 0
cairo 1.14.12 he6fea26_5 conda-forge
certifi 2018.8.24 py35_1
cffi 1.11.5 py35he75722e_1
cloudpickle 0.5.5 py35_0
cudatoolkit 9.2 0 anaconda
cudnn 7.2.1 cuda9.2_0 anaconda
cycler 0.10.0 py_1 conda-forge
cython 0.28.5 py35hf484d3e_0 anaconda
dask-core 0.19.2 py35_0
dbus 1.13.0 h3a4f0e9_0 conda-forge
decorator 4.3.0 py35_0
expat 2.2.5 hfc679d8_2 conda-forge
ffmpeg 4.0.2 ha0c5888_1 conda-forge
fontconfig 2.13.1 h65d0f4c_0 conda-forge
freetype 2.9.1 …Run Code Online (Sandbox Code Playgroud) 我Tensorflow 1.6.0在 Python 3.6.4 环境中安装了带有 anaconda 的 GPU 版本。
当我这样做时import tensorflow as tf,我收到以下错误:
ImportError: libcudnn.so.7: cannot open shared object file: No such file or directory
Run Code Online (Sandbox Code Playgroud)
不同的版本:
cudnn : 7.1.1cuda : 9.0.176tensorflow : 1.6.0Ubuntu : 16.04我知道这一点,但它没有解决我的问题。
我的 Ubuntu 16.04 系统上有一个 conda 环境。
当我使用以下命令安装 Pytorch 时:
conda install pytorch
Run Code Online (Sandbox Code Playgroud)
我尝试运行我需要的脚本,但收到错误消息:
raise AssertionError("Torch not compiled with CUDA enabled")
Run Code Online (Sandbox Code Playgroud)
通过查看论坛,我发现这是因为我安装了没有 CUDA 支持的 Pytorch。
然后我尝试:
conda install -c pytorch torchvision cudatoolkit=10.1 pytorch
Run Code Online (Sandbox Code Playgroud)
但现在我收到错误:
from torch.utils.cpp_extension import BuildExtension, CUDAExtension
File "/home/username/miniconda3/envs/super_resolution/lib/python3.6/site-packages/torch/__init__.py", line 81, in <module>
from torch._C import *
ImportError: /lib64/libc.so.6: version `GLIBC_2.14' not found
Run Code Online (Sandbox Code Playgroud)
所以看来这两个安装正在安装不同版本的 Pytorch(?)。第一个似乎有效的版本是 Pytorch 1.3.1。
我的问题:如何在启用 CUDA 的情况下安装 Pytorch,但确保其版本1.3.1适合我的系统?
当前,我需要在存在较旧版本CUDA和cuDNN的计算机上安装gpu版本的tensorflow,我的问题是,如何在不重新安装CUDA和cuDNN的情况下完成它,因为其他软件包(请参阅pytorch)需要它。
我对我的系统上安装的 CUDA 版本以及是否被我的软件有效使用有疑问。\n我在网上做了一些研究,但找不到解决我的疑问的方法。\n这个问题对我的理解有所帮助,并且是与我下面要问的问题最相关的是这个。
\n问题描述:
\n我使用 virtualenvironmentwrapper 创建了一个虚拟环境,然后在其中安装了 pytorch。
\n一段时间后,我意识到我的系统上没有安装 CUDA。
\n您可以通过执行以下操作找到它:
\nnvcc \xe2\x80\x93V
如果没有返回任何内容,则意味着您没有安装 CUDA(据我了解)。
\n因此,我按照这里的说明进行操作
\n我用这个官方链接安装了CUDA。
\n然后,我nvidia-development-kit简单地安装了
sudo apt install nvidia-cuda-toolkit
现在,如果在我的虚拟环境中我这样做:
\nnvcc -V
我得到:
\nnvcc: NVIDIA (R) Cuda compiler driver\nCopyright (c) 2005-2019 NVIDIA Corporation\nBuilt on Sun_Jul_28_19:07:16_PDT_2019\nCuda compilation tools, release 10.1, V10.1.243\nRun Code Online (Sandbox Code Playgroud)\n但是,如果(总是在虚拟环境中)我这样做:
\npython -c "import torch; print(torch.version.cuda)"
我得到:
\n10.2
这是我不明白的第一件事。我在虚拟环境中使用哪个版本的 CUDA?
\n …cuda ×6
python ×3
pytorch ×3
tensorflow ×3
conda ×2
cudnn ×2
linux ×2
anaconda ×1
caffe ×1
driver ×1
pycuda ×1
python-3.x ×1
ubuntu ×1
ubuntu-16.04 ×1