我正在执行在 GPU 上运行 Julia 1.6.5 代码的第一步。由于某种原因,GPU 似乎根本没有被使用。这些是步骤:
首先,我的 GPU 通过了CUDA Julia Docs推荐的测试:
# install the package
using Pkg
Pkg.add("CUDA")
# smoke test (this will download the CUDA toolkit)
using CUDA
CUDA.versioninfo()
using Pkg
Pkg.test("CUDA") # takes ~40 minutes if using 1 thread
Run Code Online (Sandbox Code Playgroud)
其次,下面的代码在我的 GPU 上运行大约需要 8 分钟(实时)。它加载两个矩阵 10000 x 10000 并相乘 10 次:
using CUDA
using Random
N = 10000
a_d = CuArray{Float32}(undef, (N, N))
b_d = CuArray{Float32}(undef, (N, N))
c_d = CuArray{Float32}(undef, (N, N))
for i in …Run Code Online (Sandbox Code Playgroud)