Nvidia 驱动程序安装但未在 ubuntu 18.04 上加载

szi*_*qui 26 nvidia cuda drivers nvidia-prime 18.04

Nvidia 驱动程序 384 在 Ubuntu 17.04 和 17.10 上运行良好。我切换到 Ubuntu 18.04(全新安装)并按照这个很好的答案安装了 nvidia-driver-396

然后我使用 .run 文件安装了 cuda toolkit 9.2。无论是否选择安装 nvidia 驱动程序,它都无法安装。重新启动并再次尝试,然后成功安装了cuda。但是 nvidia 没有运行。

$ nvidia-settings
ERROR: NVIDIA driver is not loaded


ERROR: Unable to load info from any available system


$ nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

$ lspci -v | grep VGA
00:02.0 VGA compatible controller: Intel Corporation HD Graphics 5500 (rev 09) (prog-if 00 [VGA controller])
Run Code Online (Sandbox Code Playgroud)

到目前为止我尝试过的:

  1. 卸载 nvidia ( nvidia-uninstall) 成功但有警告:“无法删除某些符号链接。我使用rm -rf /usr/local/cuda*nvidia-driver-396删除了 cuda并安装了 nvidia-driver-396 但仍然出现相同的错误

  2. 删除了 nvidia-396,从 nvidia 的网站(.run 文件)安装了 396。它以警告“分发提供的预脚本失败”开始。我继续,安装成功。它还自动将 nouveau 添加到黑名单。结果还是和1一样。

  3. 卸载前一个,删除黑名单条目,安装 nvidia-390 还是一样的结果

  4. 卸载前一个,从 GUI 的“附加驱动程序”安装它。没变。

  5. 进入控制台模式。停止 gdm。然后装了396。没有变化。同样安装390。没变。

  6. 尝试使用 xorg-edgers ppa(是的,据说它们与图形驱动程序 ppa 相同,但我现在很绝望)未满足的依赖性问题。所以恢复删除所有内容。

  7. 卸载所有东西,进入恢复模式,然后安装 nvidia-driver-390。没运气。

  8. 感觉官网的nvidia驱动做了一些不可逆的改动。所以尝试再次安装它,以便我可以按照使用 --unistall 选项的好答案中的建议从恢复模式正确卸载它。但是现在安装失败。错误消息显示 nouveau 尽管被列入黑名单仍在运行。我后来删除了黑名单条目

我有带 Intel HD 显卡的 Intel i5Nvidia GeForce 940M。是的 nvidia-prime 已安装。使用 Windows 10 双启动,禁用安全启动

在所有这些步骤中,一旦我能够启动 nvidia x 服务器应用程序,尽管 nvidia-smi 给出了相同的错误。一旦 cuda 运行 nvidia-xconfig 时出现解决问题。我删除了 xorg.conf 来修复它。现在我的电脑有 nouveau 运行,没有安装其他驱动程序,没有列入黑名单 nvidia,没有 xorg.conf。

有人可以帮忙吗。我看不出它不应该工作的任何理由。据报道,nvidia 驱动程序 390.12 在内核 4.15 上运行良好,但仍然无法在我的内核上运行。

szi*_*qui 9

终于安装好了!:D

主要原因是cuda工具包安装的驱动程序。它从未正确卸载。所以为了修复它,我执行了这些操作:

  1. 卸载所有与 nvidia 相关的软件包并删除所有黑名单。
  2. sudo update-initramfs -u
  3. 重启
  4. 进入控制台模式(Ctrl + Alt + F3),从 Nvidia 网站安装 Nvidia 驱动程序(.run 文件)
  5. sudo update-initramfs -u
  6. 重启
  7. 进入恢复模式, nvidia-uninstall
  8. # update-initramfs -u
  9. 重启
  10. nvidia-driver-396从图形驱动程序 ppa安装的包

现在一切正常

更新:它在重建内核和所有 dkms 模块的更新后坏了。问题在于编译 nvidia-drm 模块。如果有人有永久的解决方案,请发布它,我会更新已接受的答案


小智 5

谢谢@sziraqui - 我终于在 Ubuntu 18.04 上安装了 Nvidia 驱动程序,并提供了您的建议以及其他一些建议。这就是我必须做的。

  1. 卸载/清除所有 Nvidia 驱动程序

    sudo apt-get remove --purge nvidia* && sudo apt autoremove

  2. 从 Nvidia 网站下载 Nvidia 驱动程序(.run 文件)

  3. 禁用/黑名单 Noveau 驱动程序 https://linuxconfig.org/how-to-disable-nouveau-nvidia-driver-on-ubuntu-18-04-bionic-beaver-linux

  4. 以文本模式重新启动 输入 Grub 启动参数 - 这可以通过在启动时进入 grub 菜单来完成(在启动时按 Esc 或 Shit)在这里按 e。启用文本模式启动 - 此处添加 3 after quiet splash 并按 F10 以使用新参数重新启动。

  5. 在运行步骤 2 中下载的 Nvidia 安装程序时,识别用于我的内核并设置环境变量 CC 的 gcc。

    sudo CC=gcc-7 ./[Nvidia 安装程序 .run 文件]

安装程序设置为告诉您预安装失败 - 忽略并继续。我允许 NVidia 配置 X11 并安装 32 位库。重新启动,我的双显示器工作正常,并恢复到 1920x1080 分辨率。

似乎主要的罪魁祸首是与 Ubuntu 和 Nvidia 驱动程序一起使用的 gcc 编译器不同,因此自动安装程序永远不会工作。我希望这有助于其他人在 Ubuntu 上安装他们的 Nvidia 驱动程序!