python中是否有安装了numba或tensorflow的代码?例如,如果我想知道 GPU 内存信息,我可以简单地使用:
from numba import cuda
gpus = cuda.gpus.lst
for gpu in gpus:
with gpu:
meminfo = cuda.current_context().get_memory_info()
print("%s, free: %s bytes, total, %s bytes" % (gpu, meminfo[0], meminfo[1]))
Run Code Online (Sandbox Code Playgroud)
在 numba。但是我找不到任何代码可以为我提供每个块信息的最大线程数。我希望代码能够检测每个块的最大线程数,并进一步计算每个方向上指定的块数。
我正在使用 NUMBA 和 cupy 来执行 GPU 编码。现在我已将代码从 V100 NVIDIA 卡切换到 A100,但随后我收到以下警告:
NumbaPerformanceWarning:网格大小 (27) < 2 * SM 计数 (216) 可能会因占用率低而导致 GPU 利用率不足。
NumbaPerformanceWarning:CUDA 内核中使用的主机数组将产生与设备之间的复制开销。
有谁知道这两个警告到底意味着什么?那我应该如何改进我的代码呢?