我有一台旧的 Lenovo ThinkPad W530 笔记本电脑,配备 NVIDIA Corporation GK107GLM [Quadro K1000M] / Quadro K1000M/PCIe/SSE2 GPU,具有计算兼容性 3.0并支持 CUDA。我想在 Ubuntu 上为我的 Udacity 纳米学位构建一些 TensorFlow 示例和项目。
我刚刚安装了 Ubuntu 20.04 并升级了我的 NVIDIA 驱动程序,因此当我执行时,nvidia-smi它会给出以下结果:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.51.05 Driver Version: 450.51.05 CUDA Version: 11.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 Quadro …Run Code Online (Sandbox Code Playgroud) 我刚刚将我的系统升级到 Ubuntu 19.04 并意识到没有安装 Cuda 10.0。tensorflow 仍然不是为 Cuda 10.1 构建的,如果可能的话,我可以将我的 Nvidia 驱动程序从 418 降级到 410 会很棒。我正在使用 Geforce GTX 1060。
有没有办法在WSL2上安装tensorflow-gpu?
尝试在 WSL 上设置 CUDA 并运行后nvidia-smi,出现错误:
NVIDIA-SMI 失败,因为它无法与 NVIDIA 驱动程序通信。确保安装并运行了最新的 NVIDIA 驱动程序。
如果有人知道如何修复它,那将不胜感激。
我目前正在尝试使用 Tensorflow 2.4.0 和运行 CUDA 11.0 和 CUDNN 8 的 RTX 3070 自定义训练神经网络。
我遇到了这个奇怪的问题,我可以训练模型,但实际上无法获得任何输出,因为当我运行时:
output = model(x)
我收到以下消息,并且我的 jupyter 内核自动重新启动。
2021-01-08 20:52:53.437668: W tensorflow/stream_executor/gpu/asm_compiler.cc:191] Falling back to the CUDA driver for PTX compilation; ptxas does not support CC 8.6
2021-01-08 20:52:53.437690: W tensorflow/stream_executor/gpu/asm_compiler.cc:194] Used ptxas at /usr/local/cuda-11.0/bin/ptxas
2021-01-08 20:52:53.438427: W tensorflow/stream_executor/gpu/redzone_allocator.cc:314] Unimplemented: /usr/local/cuda-11.0/bin/ptxas ptxas too old. Falling back to the driver to compile.
Relying on driver to perform ptx compilation.
Modify $PATH to customize ptxas location.
Run Code Online (Sandbox Code Playgroud)
作为测试,我安装了 CUDA 11.1 和 …
我正在尝试为tensorflow-GPU 创建一个conda 环境。我有一个 GeForce RTX 3080,运行 Ubuntu 21.04,安装了 CUDA 460 驱动程序(禁用安全启动)。我尝试使用conda安装cudatoolkit,但是使用conda可用的最新版本是11.0,它最多只支持CUDA驱动程序450。我在网上找不到任何关于如何将新的CUDA版本安装到conda环境中的信息,只能在全局上找到使用 或 .run 文件的环境sudo(我想远离它)。我假设我使用pip install cudatoolkit=11.2或类似的东西,但我不确定。
任何帮助将不胜感激,因为我是 Linux 新手,而且我还不是终端忍者。
谢谢
我正在按照此处的步骤操作。我目前在这一步:
$ cd ~
$ mkdir installers
$ cd installers/
$ wget https://developer.nvidia.com/compute/cuda/10.0/Prod/local_installers/cuda_10.0.130_410.48_linux
$ mv cuda_10.0.130_410.48_linux cuda_10.0.130_410.48_linux.run
$ chmod +x cuda_10.0.130_410.48_linux.run
$ sudo ./cuda_10.0.130_410.48_linux.run --override
Run Code Online (Sandbox Code Playgroud)
最后一步具体。一旦我同意安装所有内容,我就会收到此错误消息:
Installing the NVIDIA display driver...
The driver installation has failed due to an unknown error. Please consult the driver installation log located at /var/log/nvidia-installer.log.
===========
= Summary =
===========
Driver: Installation Failed
Toolkit: Installation skipped
Samples: Installation skipped
Run Code Online (Sandbox Code Playgroud)
我尝试了很多方法来做到这一点,但我对困难感到困惑。有人告诉我,使用 Linux Ubuntu 进行深度学习开发是可行的方法,但至少我觉得这很荒谬。