标签: amd-rocm

Navi10 上配备 Pytorch 的 AMD ROCm(RX 5700 / RX 5700 XT)

我是拥有 AMD GPU(RX 5700、Navi10)的悲惨生物之一。我想使用最新的 PyTorch 库在本地计算机上进行一些深度学习并停止使用云实例。

我在互联网上看到 AMD 承诺在未来 2-4 个月内支持 Navi10(1-2 年前写的帖子),但是,我不认为他们发布了“官方”支持。

我在本地计算机上安装了 ROCm,它实际上检测到我的 GPU,一切看起来都很好,这是rocminfo输出。

rocminfo 输出

我安装了必要的 PyTorch ROCm 版本,但是当我尝试运行代码时,出现以下错误。

hipErrorNoBinaryForGpu:无法找到所有当前设备的代码对象!

我想这是因为 ROCm 仍然不支持 gfx1010 或者我在这一点上迷失了。

如果有人可以提供一种使 ROCm 工作的方法(最好无需再次为 gfx1010 编译整个包)提供像 CUDA 用户一样使用 AMD GPU 的方法,我会很高兴。

gpu deep-learning amd-gpu pytorch amd-rocm

7
推荐指数
1
解决办法
1万
查看次数

什么是 HIP,为什么不能在 ryzen 3400g 上运行?

我有兴趣在我的 Ryzen 3400g 系统上运行深度学习代码。我在网上看到:

我试图在我的 Ryzen 3400G 上使用 Vega 11,我知道我不能运行 HIP,但我可能可以在这个 APU 上运行 opencl,我的第一步是导入 tensorflow,但是我得到了一个错误,

这是来自https://github.com/ROCmSoftwarePlatform/tensorflow-upstream/issues/669

真的不可能将 ryzen 3400g 与 Radeon vega 11 gpu 与 tensorflow 一起使用吗?

————

是否可以改为与 opencl 一起使用(如https://missinglink.ai/guides/tensorflow/tensorflow-support-opencl/)?

gpu opencl tensorflow amd-rocm

5
推荐指数
1
解决办法
698
查看次数

如何通过 WSL 使 AMD GPU 与 DALL-E Playground AI 服务器一起使用

我正在尝试使用 AMD GPU 在本地计算机上运行和部署 Dalle Playground,我在 Windows 11 上运行 WSL 实例。

链接到 Dalle Playground 存储库

System OS: Windows 11 Pro - Version 21H1 - OS Build 22000.675
WSL Version: WSL 2 
WSL Kernel: 5.10.16.3-microsoft-standard-WSL2
WSL OS: Ubuntu 20.04 LTS
GPU: AMD Radeon RX 6600 XT
CPU: AMD Ryzen 5 3600XT (32GB ram)
Run Code Online (Sandbox Code Playgroud)

我已经能够成功部署后端和前端,但它会占用 CPU 资源。

它给了我这个警告:

    --> Starting DALL-E Server. This might take up to two minutes.
2022-06-12 01:16:33.012306: I external/org_tensorflow/tensorflow/core/tpu/tpu_initializer_helper.cc:259] Libtpu path is: libtpu.so
2022-06-12 01:16:37.581440: I external/org_tensorflow/tensorflow/compiler/xla/service/service.cc:174] XLA …
Run Code Online (Sandbox Code Playgroud)

ubuntu amd-gpu windows-subsystem-for-linux amd-rocm wsl-2

5
推荐指数
1
解决办法
2万
查看次数

无法在 Ubuntu 20.04 上安装 ROCm

我想在 Ubuntu 上为深度学习设置 AMD Radeon。我工作的主要库是 keras 和 pytorch。我在这里严格遵循 ROCm 安装指南但在使用命令的第 3 步失败了sudo apt install rocm-dkms。错误消息显示如下。

Setting up dkms (2.8.1-5ubuntu1) ...
Setting up hip-rocclr (4.0.20496.5685.40000-23) ...
Setting up rock-dkms (1:4.0-23) ...
Loading new amdgpu-4.0-23 DKMS files...
Building for 5.8.0-41-generic
Building for architecture x86_64
Building initial module for 5.8.0-41-generic
Error! Bad return status for module build on kernel: 5.8.0-41-generic (x86_64)
Consult /var/lib/dkms/amdgpu/4.0-23/build/make.log for more information.
dpkg: error processing package rock-dkms (--configure):
 installed rock-dkms package post-installation script …
Run Code Online (Sandbox Code Playgroud)

gpu deep-learning amd-rocm ubuntu-20.04

3
推荐指数
1
解决办法
3026
查看次数

Pytorch“hipErrorNoBinaryForGpu:无法找到所有当前设备的代码对象!”

系统:Ryzen 5800x、rx 6700xt、32 GB RAM、Ubuntu 22.04.1

我正在尝试按照https://youtu.be/d_CgaHyA_n4安装 Stable-Diffusion

当尝试运行 SD 脚本时,出现错误"hipErrorNoBinaryForGpu: Unable to find code object for all current devices!"

我相信这是由 PyTorch 未按预期工作引起的。当使用“ The Master Test ”验证 Pytorchs 的安装时,我收到相同的错误:

"hipErrorNoBinaryForGpu: Unable to find code object for all current devices!"
Aborted (core dumped)
Run Code Online (Sandbox Code Playgroud)

我相信它安装正确,因为使用conda list命令告诉我已经安装了 torch 1.12.0a0+git2a932eb 和 torchvision 0.13.0a0+f5afae5。有趣的是,当我将命令稍微更改为 torch.cuda.is_available(不带括号)时,我得到以下输出<function is_available at 0x7f42278788b0>:当然,我不确定这告诉我什么。经过“验证”步骤后,得到了预期的随机数数组。但是,GPU 驱动程序检查失败。

先感谢您。

pytorch amd-rocm

3
推荐指数
1
解决办法
7293
查看次数