标签: cuda

使用 CUDA 11.2 和 cuDNN 8.1-8.2 设置 TensorFlow-GPU Conda 环境(CUDA 460 驱动程序

我正在尝试为tensorflow-GPU 创建一个conda 环境。我有一个 GeForce RTX 3080,运行 Ubuntu 21.04,安装了 CUDA 460 驱动程序(禁用安全启动)。我尝试使用conda安装cudatoolkit,但是使用conda可用的最新版本是11.0,它最多只支持CUDA驱动程序450。我在网上找不到任何关于如何将新的CUDA版本安装到conda环境中的信息,只能在全局上找到使用 或 .run 文件的环境sudo(我想远离它)。我假设我使用pip install cudatoolkit=11.2或类似的东西,但我不确定。

任何帮助将不胜感激,因为我是 Linux 新手,而且我还不是终端忍者。

谢谢

nvidia cuda conda tensorflow gpu-driver

3
推荐指数
1
解决办法
8167
查看次数

软件包依赖于其自身的更高版本(nvidia-kernel-common)

我在启动时收到有关损坏的软件包的错误通知。我的电脑速度很慢。当我按照运行包管理器或运行的建议时apt upgrade,我得到:

nvidia-kernel-common-465 : Depends: nvidia-kernel-common-470 but it is not installed
Run Code Online (Sandbox Code Playgroud)

我试过:

$ sudo apt --fix-broken install
...
dpkg: error processing archive /var/cache/apt/archives/nvidia-kernel-common-470_470.57.02-1pop0~1627044105~18.04~f9815ed~dev_amd64.deb (--unpack):
 trying to overwrite '/lib/systemd/system/nvidia-hibernate.service', which is also in package nvidia-driver-465 465.31-1pop0~1623777959~18.04~a3ca7f3~dev
Errors were encountered while processing:
 /var/cache/apt/archives/nvidia-kernel-common-470_470.57.02-1pop0~1627044105~18.04~f9815ed~dev_amd64.deb
E: Sub-process /usr/bin/dpkg returned an error code (1)
Run Code Online (Sandbox Code Playgroud)

这是我当前的设备:

$ ubuntu-drivers devices
WARNING:root:_pkg_get_support nvidia-driver-390: package has invalid Support Legacyheader, cannot determine support level
== /sys/devices/pci0000:00/0000:00:03.1/0000:0a:00.0 ==
modalias : pci:v000010DEd00001D01sv00001462sd00008C98bc03sc00i00
vendor   : NVIDIA Corporation
model    : GP108 [GeForce …
Run Code Online (Sandbox Code Playgroud)

package-management nvidia cuda 18.04

3
推荐指数
1
解决办法
1564
查看次数

无法在 Ubuntu 22.04 上安装 cuDNN 8.5.0.96,显示“公共 CUDA GPG 密钥似乎未安装”

系统信息:

OS: Ubuntu 22.04.1 LTS x86_64 
Kernel: 5.15.0-47-generic 
Uptime: 19 mins 
Packages: 2225 (dpkg), 11 (snap) 
Shell: bash 5.1.16 
Resolution: 3840x2160 
DE: GNOME 42.4 
WM: Mutter 
WM Theme: Adwaita 
Theme: Yaru [GTK2/3] 
Icons: Yaru [GTK2/3] 
Terminal: gnome-terminal 
CPU: Intel i9-9900K (16) @ 5.000GHz 
GPU: NVIDIA GeForce RTX 2080 
Memory: 2164MiB / 64225MiB 
Run Code Online (Sandbox Code Playgroud)

使用以下代码安装Cuda:

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda-repo-ubuntu2204-11-7-local_11.7.1-515.65.01-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2204-11-7-local_11.7.1-515.65.01-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-11-7-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda
Run Code Online (Sandbox Code Playgroud)

看来 cuda 已成功安装在我的设备上,因为运行时 …

nvidia cuda conda

3
推荐指数
1
解决办法
1万
查看次数

尝试验证 cudnn 安装时出现“FreeImage 设置不正确。请确保 FreeImage 设置正确”错误

我按照以下步骤操作:

https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html来设置 cudnn。

一切似乎都运行良好,但是当我执行“make clean && make”时,我收到了标题中显示的警告,并且没有创建 mnistCUDNN。

有人建议使用以下方法设置 CUDA_PATH:export CUDA_PATH=/usr/local.cuda-9.0

但它不起作用。我也试过:

须藤 ln -s /usr/local/cuda-9.0/ /usr/local/cuda-9.0

但同样的问题。然后,我尝试:

须藤 ln -s /usr/local/cuda-9.0/ /usr/local/cuda

再次,同样的问题。

正如有人提到的那样,我还执行了以下行:

cat /usr/include/x86_64-linux-gnu/cudnn_v7.h | grep CUDNN_MAJOR -A 2

但我仍然得到:

make clean && make rm -rf *o rm -rf mnistCUDNN /usr/bin/ld: -lcublas 找不到 collect2: 错误: ld 返回 1 退出状态

警告 - FreeImage 设置不正确。请确保正确设置 FreeImage。<<< : : :

执行“sudo dpkg -i libcudnn7*.deb”并重复第 2.4 节验证 cuDNN 已安装导致相同的错误。

执行: nvcc --version

导致“找不到命令‘nvcc’,但可以安装:

sudo apt 安装 nvidia-cuda-toolkit”

不确定我是否需要这样做。

你能帮忙解决这个问题吗?

另外,我担心我可能会设置错误的路径并创建错误的符号链接。请让我知道如何撤消上述三行不起作用的命令。

nvidia cuda

2
推荐指数
1
解决办法
3906
查看次数

CUDA 什么时候支持 ubuntu 18.10

我需要使用 CUDA 进行工作并升级了 Ubuntu,而没有检查(我的错)CUDA 是否支持 Ubuntu 18.10,结果证明它不支持。

最后支持的版本是 Ubuntu 18.04.5。您认为 CUDA 什么时候会支持 Ubuntu 18.10?如果需要一段时间,将我的版本降级到 18.04 的最佳方法是什么?

谢谢你的时间。

nvidia cuda unsupported-packages drivers 18.10

2
推荐指数
1
解决办法
5151
查看次数

尝试安装 cuda 后 apt 崩溃

Ubuntu版本:18.04 Apt版本:1.6.13

我尝试安装不同的 cuda 工具包,这样做可能会导致 apt 无法挽回地损坏。我相信这个问题与 cuda 无关,而 apt 在这里出了问题。

如果我运行sudo apt-get install *anything*(或 apt remove 或 apt purge),我会收到错误:

Reading package lists... Done Building dependency tree Reading state information... Done cuda is already the newest version (11.2.2-1). You might want to run 'apt --fix-broken install' to correct these. The following packages have unmet dependencies. cuda-drivers-460 : Depends: libnvidia-common-460 (>= 460.32.03) but it is not going to be installed libnvidia-gl-460 : Depends: libnvidia-common-460 but it is not going …

package-management apt nvidia cuda

2
推荐指数
1
解决办法
1万
查看次数

Ubuntu 18.04 LTC 中的英特尔第 12 代 CPU

我想做一台由Intel 12代CPU(I9-12900)组成的电脑,由于我的特殊软件需要安装Ubuntu 18.04版本。(仅硬件升级)这台电脑能正常工作吗?(我所有的搜索都显示第 12 代在 Ubuntu 20.04 中导致问题。)此外,对于 VGA、RTX 3060 或更高级别的显卡可以在该系统上工作吗?

nvidia intel cuda drivers 18.04

2
推荐指数
1
解决办法
3364
查看次数

使用 GPU 支持安装 tensorflow。安装 GPU 先决条件后缺少 libcublas.so.9.0

我正在尝试在 Ubuntu 16.04 64x 上为使用 Python 3.6 的 conda 环境安装支持 GPU 的 Tensorflow。

我尝试安装所有GPU 要求,然后pip install --ignore-installed --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.10.0-cp36-cp36m-linux_x86_64.whl从我的 conda 环境中运行。

但是,当我打开 Python 终端并尝试时,import tensorflow as tf我得到了一个ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory.

这是要求的状态:

  • NVIDIA 驱动程序版本:384.130(这是 的输出nvidia-smi
  • CUDA 编译器驱动程序:(release 7.5, V7.5.17这是 的输出nvcc -v
  • CUDA:版本 9.2.148(这是 的输出cat /usr/local/cuda/version.txt)。我真的很困惑,因为我在其他地方读到 CUDA 版本和 nvcc 版本应该匹配。
  • cuDNN:我想我已经安装了?我下载了 .deb 包,sudo dpkg -i /path/to/deb/file然后是 …

python nvidia cuda drivers

1
推荐指数
1
解决办法
9201
查看次数

Tensorflow 2.0 Cuda 10.0 安装

我正在按照此处的步骤操作。我目前在这一步:

$ cd ~
$ mkdir installers
$ cd installers/
$ wget https://developer.nvidia.com/compute/cuda/10.0/Prod/local_installers/cuda_10.0.130_410.48_linux
$ mv cuda_10.0.130_410.48_linux cuda_10.0.130_410.48_linux.run
$ chmod +x cuda_10.0.130_410.48_linux.run
$ sudo ./cuda_10.0.130_410.48_linux.run --override
Run Code Online (Sandbox Code Playgroud)

最后一步具体。一旦我同意安装所有内容,我就会收到此错误消息:

Installing the NVIDIA display driver...
The driver installation has failed due to an unknown error. Please consult the driver installation log located at /var/log/nvidia-installer.log.

===========
= Summary =
===========

Driver:   Installation Failed
Toolkit:  Installation skipped
Samples:  Installation skipped
Run Code Online (Sandbox Code Playgroud)

我尝试了很多方法来做到这一点,但我对困难感到困惑。有人告诉我,使用 Linux Ubuntu 进行深度学习开发是可行的方法,但至少我觉得这很荒谬。

nvidia cuda tensorflow

1
推荐指数
1
解决办法
423
查看次数

安装 cuda 时无法修复损坏的软件包

我想在 ubuntu 20.04 上安装 CUDA 并按照此处的说明进行操作https://linuxconfig.org/how-to-install-cuda-on-ubuntu-20-04-focal-fossa-linux

但是我已经从 ubuntu 存储库安装了 nvidia-cuda-toolkit 软件包,但后来发现我需要 10.2 版。

所以我做了一个apt-get remove nvidia-cuda-toolkit,然后按照从 cuda repo 安装的说明进行了操作,但由于软件包损坏而失败(卸载 nvidia-cuda-toolkit 不干净)。

现在我被困住了。我试试这个:

# apt-get remove cuda
Reading package lists... Done
Building dependency tree       
Reading state information... Done
Package 'cuda' is not installed, so not removed
You might want to run 'apt --fix-broken install' to correct these.
The following packages have unmet dependencies.
 cuda-libraries-10-2 : Depends: libcublas10 (>= 10.2.2.89) but 10.1.243-3 is to be installed
 libcublas-dev : Depends: …
Run Code Online (Sandbox Code Playgroud)

package-management apt cuda

1
推荐指数
1
解决办法
3169
查看次数

在带有 Nvida GTX 1060 的 Ubuntu 20.04 中安装 CUDA 11

我最近尝试按照网站上的说明在 Ubuntu Mate 20.04 中为 Ubuntu 18.04安装CUDA 11.0。我试图通过运行以文本模式(运行级别 3)安装 CUDA,但我收到关于无法安装. 所以我跑了,我得到:sudo apt-get install cudalibnvidia-compute-450sudo apt-get --fix-broken install

Reading package lists... Done
Building dependency tree       
Reading state information... Done
Correcting dependencies... Done
The following packages were automatically installed and are no longer required:
  libatomic1:i386 libbsd0:i386 libdrm-amdgpu1:i386 libdrm-intel1:i386 libdrm-nouveau2:i386 libdrm-radeon1:i386
  libdrm2:i386 libedit2:i386 libelf1:i386 libexpat1:i386 libffi7:i386 libgl1:i386 libgl1-mesa-dri:i386
  libglapi-mesa:i386 libglvnd0:i386 libglx-mesa0:i386 libglx0:i386 libllvm9:i386 libnvidia-common-440
  libnvidia-extra-440 libpciaccess0:i386 libsensors5:i386 libstdc++6:i386 libvulkan1:i386
  libwayland-client0:i386 libx11-6:i386 libx11-xcb1:i386 libxau6:i386 libxcb-dri2-0:i386 …
Run Code Online (Sandbox Code Playgroud)

dpkg cuda ubuntu-mate 20.04

1
推荐指数
1
解决办法
5804
查看次数

如何正确删除 Ubuntu 20.04 存储库?

问题。rm更新 apt 存储库时要运行什么命令cuda-ubuntu2004-x86_64.list

-rw-r--r-- 1 root root   80 Aug 15 11:47 cuda.list
-rw-r--r-- 1 root root   80 Aug 15 11:47 cuda.list.save
-rw-r--r-- 1 root root  149 Aug 15 11:47 cuda-ubuntu2004-cross-linux-sbsa.list
-rw-r--r-- 1 root root  149 Aug 15 11:47 cuda-ubuntu2004-cross-linux-sbsa.list.save
-rw-r--r-- 1 root root  139 Aug 15 11:47 cuda-ubuntu2004-x86_64.list
-rw-r--r-- 1 root root  139 Aug 15 11:47 cuda-ubuntu2004-x86_64.list.save
Run Code Online (Sandbox Code Playgroud)

问题

apt cuda 20.04

1
推荐指数
1
解决办法
1万
查看次数

E:关于源 https://developer.download.nvidia.com/compute/cuda/repos/ 的选项 Signed-By 设置的冲突值

乌班图18.04

E: Conflicting values set for option Signed-By regarding source https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/ /: /usr/share/keyrings/cuda-archive-keyring.gpg !=
Run Code Online (Sandbox Code Playgroud)

我的桌面卡在黑屏“文件系统检查”上,运行时出现上述错误

sudo apt-get remove --purge nvidia-*
Run Code Online (Sandbox Code Playgroud)

请帮我解决这个问题

apt nvidia cuda drivers 18.04

1
推荐指数
1
解决办法
3188
查看次数