小编ZHA*_*ie 的帖子

我如何知道安装了 numba 或 tensorflow 的 python 代码中每个块的最大线程数?

python中是否有安装了numba或tensorflow的代码?例如,如果我想知道 GPU 内存信息,我可以简单地使用:

from numba import cuda
gpus = cuda.gpus.lst
for gpu in gpus:
    with gpu:
        meminfo = cuda.current_context().get_memory_info()
        print("%s, free: %s bytes, total, %s bytes" % (gpu, meminfo[0], meminfo[1]))
Run Code Online (Sandbox Code Playgroud)

在 numba。但是我找不到任何代码可以为我提供每个块信息的最大线程数。我希望代码能够检测每个块的最大线程数,并进一步计算每个方向上指定的块数。

python cuda numba tensorflow

2
推荐指数
1
解决办法
1271
查看次数

由于占用率低而导致 GPU 利用率不足是什么意思?

我正在使用 NUMBA 和 cupy 来执行 GPU 编码。现在我已将代码从 V100 NVIDIA 卡切换到 A100,但随后我收到以下警告:

  1. NumbaPerformanceWarning:网格大小 (27) < 2 * SM 计数 (216) 可能会因占用率低而导致 GPU 利用率不足。

  2. NumbaPerformanceWarning:CUDA 内核中使用的主机数组将产生与设备之间的复制开销。

有谁知道这两个警告到底意味着什么?那我应该如何改进我的代码呢?

cuda numba cupy

2
推荐指数
1
解决办法
5615
查看次数

标签 统计

cuda ×2

numba ×2

cupy ×1

python ×1

tensorflow ×1