nvidia-smi、nvtop、nvcc 问题 [Ubuntu 22.04](混合 GPU)

rak*_*ksa 5 nvidia drivers 22.04

我知道有数千篇关于如何安装驱动程序的帖子,我尝试了几个但没有任何帮助。

让我描述一下我是如何解决我的问题的。我的 GPU 是 NVIDIA GeForce RTX 3050 Mobile CUDA 可用

  1. 我使用 pic 清除了当前(当时)的驱动程序sudo apt-get purge nvidia-* (我从其他驱动程序中获取了图像)(当时没有变灰)--> 驱动程序

  2. sudo apt-get update之后运行了几个命令sudo apt-get autoremove

  3. apt search nvidia-driver 我那里有 20 多个选择吗?470、535、390、525 等

  4. 使用安装驱动程序版本 470 sudo apt install nvidia-driver-470。我应该提一下,nvidia 网站说驱动程序版本 535 pic(当时没有变灰)-->对于我的 GPU

  5. 做过sudo reboot

  6. 再次登录ubuntu,勾选Additional Drivers(驱动安装好,因为打勾了)(当时没有灰显)470

这时候多个问题出现了!注意我还没有安装 CUDA!

  1. nvidia-smiNVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
  2. 我安装了sudo apt install nvtop,但是nvtop返回No GPU to monitor.

现在变得很奇怪

  1. 安装了CUDA sudo apt install nvidia-cuda-toolkit nvidia-cuda-toolkit-gccnvcc --version11.5

然而,步骤 9 以某种方式“删除”了 nvidia utils。当我nvidia-smi再次运行时,它返回:

Command 'nvidia-smi' not found, but can be installed with:
sudo apt install nvidia-utils-390         # version 390.157-0ubuntu0.22.04.2, or
sudo apt install nvidia-utils-418-server  # version 418.226.00-0ubuntu5~0.22.04.1
sudo apt install nvidia-utils-450-server  # version 450.248.02-0ubuntu0.22.04.1
sudo apt install nvidia-utils-470         # version 470.199.02-0ubuntu0.22.04.1
sudo apt install nvidia-utils-470-server  # version 470.199.02-0ubuntu0.22.04.1
sudo apt install nvidia-utils-525         # version 525.125.06-0ubuntu0.22.04.1
sudo apt install nvidia-utils-525-server  # version 525.125.06-0ubuntu0.22.04.1
sudo apt install nvidia-utils-510-server  # version 510.47.03-0ubuntu3
sudo apt install nvidia-utils-510         # version 510.108.03-0ubuntu0.22.04.1
sudo apt install nvidia-utils-515         # version 515.105.01-0ubuntu0.22.04.1
sudo apt install nvidia-utils-515-server  # version 515.105.01-0ubuntu0.22.04.1
sudo apt install nvidia-utils-530         # version 530.41.03-0ubuntu0.22.04.2
sudo apt install nvidia-utils-535         # version 535.54.03-0ubuntu0.22.04.1

Run Code Online (Sandbox Code Playgroud)

我尝试安装sudo apt install nvidia-utils-470。它已安装,但如果我运行nvcc --version“未找到 nvcc 命令”之类的内容,它会删除我的 CUDA。这是我陷入的死亡循环。

  1. 现在,当我尝试检查“附加驱动程序”时,除此之外的所有内容均呈灰色 -->其他驱动程序

我找到了这篇文章,但我不确定它是否会起作用+我有点不清楚(Ubuntu 22.04无法安装nvidia-utils-515和nvidia-cuda-toolkit

编辑:

ed1)我没有cuda文件夹,/usr/local/nvcc可以

ed2) 我昨天尝试安装驱动程序版本 535。最后重新安装ubuntu。

ed3) 内核版本 5.19.0-46-generic

我找到了这篇文章,但我不确定它是否会起作用+我有点不清楚(Ubuntu 22.04无法安装nvidia-utils-515和nvidia-cuda-toolkit

ed4)尝试了上面的链接,没有帮助!

ed5)我尝试使用 5.15.0-76-generic 安装 ubuntu 20.04。我按照同样的步骤操作,没有任何作用。现在我怀疑这可能是因为我的笔记本电脑上有 2 个 GPU(Asus ROG strix g15 G15RC)。

  • 第一的。AMD ATI 06:00.0 设备 1681
  • 第二。NVIDIA 01:00.0 NVIDIA Corporation Device 25a2(有趣的是在 Ubuntu 20.04 系统中看不到我有什么 NVIDIA GPU 型号)

rak*_*ksa 3

问题解决了!

注意,我安装Ubuntu 20.04是因为Ubuntu 22.04的内核问题!

我的笔记本电脑有 2 个 GPU(混合 GPU)

我注意到 NVIDIA X 服务器设置没有显示我的任何 GPU。所以,我开始解决这个问题,碰巧发现了我的混合 GPU

  1. sudo apt install nvidia-driver-470
  2. sudo reboot
  3. sudo apt install nvidia-cuda-toolkit
  4. 然后我在 BIOS 设置中禁用“安全启动”

完毕!


归档时间:

查看次数:

7603 次

最近记录:

2 年,10 月 前