标签: nvidia

安装 cuda-toolkit 后 nvidia-smi 停止工作

总长DR

我正在尝试nvidia-smi恢复,在安装 cuda-toolkit 之前一切正常。卸载 cuda-toolkit 没有帮助。如何恢复nvidia-smi输出?

NVIDIA-SMI 失败,因为它无法与 NVIDIA 驱动程序通信。确保已安装并运行最新的 NVIDIA 驱动程序。


更多细节

我在运行 Ubuntu 18.04 的笔记本电脑上安装了 GEFORCE RTX 2070,并已从官方运行文件成功安装了其驱动程序NVIDIA-Linux-x86_64-470.63.01.runnvidia-smi这是该安装的输出:

在此输入图像描述

接下来,我从官方运行文件安装了 cuda-toolkit cuda_11.4.2_470.57.02_linux.run,确保取消选择驱动程序安装。这是安装完成后的终端窗口:

在此输入图像描述

就在我这样做之后nvidia-smi,我得到:

NVIDIA-SMI 失败,因为它无法与 NVIDIA 驱动程序通信。确保已安装并运行最新的 NVIDIA 驱动程序。

由于 cuda-toolkit 的安装可能“损坏” nvidia-smi,因此我卸载了 cuda-toolkit (通过运行cuda-uninstallerfind in /usr/local/cuda-11.4/bin,如安装后生成的文本中所述)。

不幸的是,这没有帮助,而且nvidia-smi仍然被损坏。我从官方 NVIDIA 运行文件安装的原因是因为之前我在从 Ubuntu 存储库安装驱动程序时遇到了问题,但可以使其与官方驱动程序一起使用。所以我想我应该尝试使用 cuda-toolkit 进行同样的操作。

我怎样才能回来nvidia-smi

一些命令的输出(如果相关)

  • which nvidia-smi : /usr/bin/nvidia-smi
  • mokutil --sb-state : SecureBoot disabled
  • nvidia-settings : …

nvidia cuda hardware-enablement-stack 18.04

4
推荐指数
1
解决办法
1万
查看次数

是否可以在 Ubuntu 18.04 LTS 上安装高于 5.4 的内核并激活 Nvidia 驱动程序?

我发现只有内核版本 5.4 可通过名为 的 HWE 软件包用于 Ubuntu 18.04 LTS linux-image-generic-hwe-18.04

众所周知,Mainline 内核无法与 Ubuntu 存储库中的 Nvidia 驱动程序配合使用。

如何获取更新的内核版本?

nvidia kernel drivers 18.04 gpu-driver

4
推荐指数
1
解决办法
1660
查看次数

CUDA安装,无法理解的冲突

已解决,最初的问题以及所有错误消息和尝试如下。

对于那些将来访问此页面的人:

  • 经过我所做的所有尝试后,接受的答案有效,您需要从评论中重建
  • 按照接受的答案中所示安装后,我遇到了 nvcc 问题,该问题仍停留在版本 10.1 上。为了获取最新版本(或与您安装的 CUDA 版本相对应的版本),请记住执行强制安装后操作

评论中建议的原始问题和尝试

昨天,我的 Ubuntu 20.04 机器意识到它存在 CUDA 冲突。我无法修复它们,因此我决定使用nvidia 网站上的说明卸载它:

sudo apt-get --purge remove <package_name>          # Ubuntu
Run Code Online (Sandbox Code Playgroud)

我可能做出了一些错误的选择,但我不知道是哪一个。

然后我按照此处的说明进行操作,适用于 Ubuntu。我最终到达此页面并按照说明进行操作。

这就是我所拥有的:

sudo apt-get -y install cuda
Reading package lists... Done
Building dependency tree       
Reading state information... Done
Some packages could not be installed. This may mean that you have
requested an impossible situation or if you are using the unstable
distribution …
Run Code Online (Sandbox Code Playgroud)

package-management nvidia dependencies cuda

4
推荐指数
1
解决办法
9320
查看次数

在 Ubuntu 18.04 中强制使用 CUDA 工具包版本 11.6,存储库中的最新版本是 9.1

我刚刚按照 nvidia 网站中的说明安装了 cuda:

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local_installers/cuda-repo-ubuntu1804-11-6-local_11.6.0-510.39.01-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804-11-6-local_11.6.0-510.39.01-1_amd64.deb
sudo apt-key add /var/cuda-repo-ubuntu1804-11-6-local/7fa2af80.pub
sudo apt-get update
sudo apt-get -y install cuda
Run Code Online (Sandbox Code Playgroud)

然后我安装了 nvidia-cuda-toolkit:

sudo apt install nvidia-cuda-toolkit
Run Code Online (Sandbox Code Playgroud)

所有这一切都没有出现问题,但它安装了工具包的 9.1 版本:

$ nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Nov__3_21:07:56_CDT_2017
Cuda compilation tools, release 9.1, V9.1.85
Run Code Online (Sandbox Code Playgroud)

我需要 11.1 或更高版本的工具包,但似乎 9.1 是存储库中的最新版本:

$ sudo apt install nvidia-cuda-toolkit
Reading package lists... Done
Building dependency tree       
Reading state information... …
Run Code Online (Sandbox Code Playgroud)

package-management apt nvidia cuda drivers

4
推荐指数
1
解决办法
1万
查看次数

使用 Nouveau + wayland_22.04 暂停后无法登录

我遇到了 22.04 的暂停问题,因此正在使用不同的驱动程序测试 x11/wayland 的不同组合。我发现使用Nouveau + wayland组合时暂停后无法登录。系统提示输入密码,但是输入密码后,弹出加载图标并永久加载。尝试单击它,密码提示消失,并留下登录屏幕,没有提示。顶栏图标和选项仍然可用,因此可以重新启动或关闭。这是其他组合中唯一存在此登录问题的组合。

仅供参考,我只能使用 Nividia 390 驱动程序运行而不会出现暂停问题,并且默认情况下 390 不提供 wayland 选项。并且暂停问题(黑屏、带有代码的黑屏等...)在 Nividia 510 驱动程序上仍然存在韦兰和X11。

好心提醒

nvidia suspend nouveau login 22.04

4
推荐指数
1
解决办法
2493
查看次数

apt autoremove 出现问题,发行版想要删除 nvidia 相关包并检测到主题无用

删除破坏了我的系统的 Ghostscript 后,我​​安装了新的 Ubuntu。每次我想安装某些东西时,我都会收到以下警告:

The following packages were automatically installed and are no longer required:
  chromium-codecs-ffmpeg-extra gstreamer1.0-vaapi libfwupdplugin1
  libgstreamer-plugins-bad1.0-0 libnvidia-cfg1-470 libnvidia-common-470
  libnvidia-decode-470 libnvidia-encode-470 libnvidia-extra-470
  libnvidia-fbc1-470 libnvidia-gl-470 libnvidia-ifr1-470 libx11-xcb1:i386
  libxnvctrl0 linux-headers-5.13.0-30-generic linux-hwe-5.13-headers-5.13.0-30
  linux-image-5.13.0-30-generic linux-modules-5.13.0-30-generic
  linux-modules-extra-5.13.0-30-generic
  linux-modules-nvidia-470-5.13.0-30-generic
  linux-objects-nvidia-470-5.13.0-30-generic
  linux-signatures-nvidia-5.13.0-30-generic nvidia-compute-utils-470
  nvidia-prime nvidia-settings nvidia-utils-470 screen-resolution-extra
  xserver-xorg-video-nvidia-470
Run Code Online (Sandbox Code Playgroud)

我不知道为什么Ubuntu要删除所有与我的显卡NVIDIA相关的东西?这些包重要吗?我应该如何保存主题或关闭此警告?我之前曾经遇到过这个问题,通过删除Ghostscript包,几乎删除了我需要的所有核心包。现在我也害怕删除这些。

package-management apt nvidia drivers

4
推荐指数
1
解决办法
1195
查看次数

Failed to start default target: Transaction for.graphical.target/start is destructive

I have installed Nvidia drivers then I restarted the laptop. When I typed exit on root@name:~# terminal, the following message appears in red:

\n
Failed to start default target: Transaction for.graphical.target/start is destructive (emergency.target has \xe2\x80\x98start\xe2\x80\x99 job queued, but \xe2\x80\x98stop\xe2\x80\x99 is included in transaction)\n
Run Code Online (Sandbox Code Playgroud)\n

显示错误消息的屏幕截图

\n

Can I downgrade to default graphics drivers using the terminal?

\n

command-line nvidia graphics drivers

4
推荐指数
1
解决办法
1万
查看次数

Google Chrome 在 Ubuntu 23.04 上模糊(Wayland + Nvidia 3050 Ti HiDPI 屏幕,缩放 200%)

我在 Dell XPS 9520 (Nvidia 3050 Ti) 上使用 Ubuntu 23.04,并使用来自 Canonical 存储库的最新驱动程序。当前版本是530,但525也存在该问题。

由于某种原因,Google Chrome 在我的 200% 缩放的 4k 屏幕上看起来极其模糊。

臭氧chrome://flags 属性有一个Wayland值。

最奇怪的事情是从终端启动应用程序,它--force-device-scale-factor=2提供了一个尖锐的 Chrome 界面,它不听光标并且无法调整大小。我只能在终端中停止该进程。

所有其他软件,包括 .deb 版本的 Firefox 和专有工具,都非常有用。

我可以采取什么措施来强制 Chrome 在我的笔记本电脑上正确呈现?

nvidia google-chrome wayland scaling hdpi

4
推荐指数
1
解决办法
2970
查看次数

为什么 Spotify (WINE) 这么慢?

我正在使用 Unity 和 wine1.3。Spotify 安装正常,但在窗口中的每一次点击都会使整个系统在几秒钟内难以置信地变慢。系统监视器显示 Xorg 突然开始使用约 50% 的 CPU。

我也在使用 nVidia 道具。驱动程序,但这个问题可能更多地与 wine/unity 有关

nvidia wine unity 11.04 spotify

3
推荐指数
1
解决办法
1144
查看次数

只有一台显示器显示 nvidia-settings 中的选项

我在 Ubuntu 11.04 上设置了双显示器。一个是戴尔,另一个是 HannsG。我怀疑 HannsG 显示器设置不正确,因为颜色看起来很奇怪。

我认为问题在于nvidia-settings没有为我的 HannsG 显示器显示所有选项。

戴尔显示器设置: 在此处输入图片说明

HannsG 显示器设置 在此处输入图片说明

这是我的相关部分 xorg.conf

Section "Screen"
    Identifier     "Screen0"
    Device         "Device0"
    Monitor        "Monitor0"
    DefaultDepth    24
    Option         "TwinView" "1"
    Option         "metamodes" "CRT: nvidia-auto-select +1280+0, DFP: nvidia-auto-select +0+0"
    SubSection     "Display"
    Depth       24
EndSubSection
Run Code Online (Sandbox Code Playgroud)

问题 我需要做什么才能看到我的 HannsG 显示器的所有设置?

nvidia multiple-monitors 11.04

3
推荐指数
1
解决办法
952
查看次数