我是拥有 AMD GPU(RX 5700、Navi10)的悲惨生物之一。我想使用最新的 PyTorch 库在本地计算机上进行一些深度学习并停止使用云实例。
我在互联网上看到 AMD 承诺在未来 2-4 个月内支持 Navi10(1-2 年前写的帖子),但是,我不认为他们发布了“官方”支持。
我在本地计算机上安装了 ROCm,它实际上检测到我的 GPU,一切看起来都很好,这是rocminfo输出。
我安装了必要的 PyTorch ROCm 版本,但是当我尝试运行代码时,出现以下错误。
hipErrorNoBinaryForGpu:无法找到所有当前设备的代码对象!
我想这是因为 ROCm 仍然不支持 gfx1010 或者我在这一点上迷失了。
如果有人可以提供一种使 ROCm 工作的方法(最好无需再次为 gfx1010 编译整个包)或提供像 CUDA 用户一样使用 AMD GPU 的方法,我会很高兴。
我有兴趣在我的 Ryzen 3400g 系统上运行深度学习代码。我在网上看到:
我试图在我的 Ryzen 3400G 上使用 Vega 11,我知道我不能运行 HIP,但我可能可以在这个 APU 上运行 opencl,我的第一步是导入 tensorflow,但是我得到了一个错误,
这是来自https://github.com/ROCmSoftwarePlatform/tensorflow-upstream/issues/669
真的不可能将 ryzen 3400g 与 Radeon vega 11 gpu 与 tensorflow 一起使用吗?
————
是否可以改为与 opencl 一起使用(如https://missinglink.ai/guides/tensorflow/tensorflow-support-opencl/)?
我正在尝试使用 AMD GPU 在本地计算机上运行和部署 Dalle Playground,我在 Windows 11 上运行 WSL 实例。
System OS: Windows 11 Pro - Version 21H1 - OS Build 22000.675
WSL Version: WSL 2
WSL Kernel: 5.10.16.3-microsoft-standard-WSL2
WSL OS: Ubuntu 20.04 LTS
GPU: AMD Radeon RX 6600 XT
CPU: AMD Ryzen 5 3600XT (32GB ram)
Run Code Online (Sandbox Code Playgroud)
我已经能够成功部署后端和前端,但它会占用 CPU 资源。
它给了我这个警告:
--> Starting DALL-E Server. This might take up to two minutes.
2022-06-12 01:16:33.012306: I external/org_tensorflow/tensorflow/core/tpu/tpu_initializer_helper.cc:259] Libtpu path is: libtpu.so
2022-06-12 01:16:37.581440: I external/org_tensorflow/tensorflow/compiler/xla/service/service.cc:174] XLA …Run Code Online (Sandbox Code Playgroud) 我想在 Ubuntu 上为深度学习设置 AMD Radeon。我工作的主要库是 keras 和 pytorch。我在这里严格遵循 ROCm 安装指南,但在使用命令的第 3 步失败了sudo apt install rocm-dkms。错误消息显示如下。
Setting up dkms (2.8.1-5ubuntu1) ...
Setting up hip-rocclr (4.0.20496.5685.40000-23) ...
Setting up rock-dkms (1:4.0-23) ...
Loading new amdgpu-4.0-23 DKMS files...
Building for 5.8.0-41-generic
Building for architecture x86_64
Building initial module for 5.8.0-41-generic
Error! Bad return status for module build on kernel: 5.8.0-41-generic (x86_64)
Consult /var/lib/dkms/amdgpu/4.0-23/build/make.log for more information.
dpkg: error processing package rock-dkms (--configure):
installed rock-dkms package post-installation script …Run Code Online (Sandbox Code Playgroud) 系统:Ryzen 5800x、rx 6700xt、32 GB RAM、Ubuntu 22.04.1
我正在尝试按照https://youtu.be/d_CgaHyA_n4安装 Stable-Diffusion
当尝试运行 SD 脚本时,出现错误"hipErrorNoBinaryForGpu: Unable to find code object for all current devices!"。
我相信这是由 PyTorch 未按预期工作引起的。当使用“ The Master Test ”验证 Pytorchs 的安装时,我收到相同的错误:
"hipErrorNoBinaryForGpu: Unable to find code object for all current devices!"
Aborted (core dumped)
Run Code Online (Sandbox Code Playgroud)
我相信它安装正确,因为使用conda list命令告诉我已经安装了 torch 1.12.0a0+git2a932eb 和 torchvision 0.13.0a0+f5afae5。有趣的是,当我将命令稍微更改为 torch.cuda.is_available(不带括号)时,我得到以下输出<function is_available at 0x7f42278788b0>:当然,我不确定这告诉我什么。经过“验证”步骤后,得到了预期的随机数数组。但是,GPU 驱动程序检查失败。
先感谢您。
amd-rocm ×5
gpu ×3
amd-gpu ×2
pytorch ×2
opencl ×1
tensorflow ×1
ubuntu ×1
ubuntu-20.04 ×1
windows-subsystem-for-linux ×1
wsl-2 ×1