如果 GPU 已使用,Cupy 在 multithread.pool 中会出现错误

Jér*_*ard 5 python-3.x python-multiprocessing cupy

我尝试在程序的两个部分中使用 cupy,其中之一与池并行。我设法用一个简单的例子重现它:

import cupy
import numpy as np
from multiprocessing import pool


def f(x):
    return cupy.asnumpy(2*cupy.array(x))



input = np.array([1,2,3,4])
print(cupy.asnumpy(cupy.array(input)))


print(np.array(list(map(f, input))))

p = pool.Pool(4)
output = p.map(f, input)
p.close()
p.join()
print(output)
Run Code Online (Sandbox Code Playgroud)

输出如下:

[1 2 3 4]
[2 4 6 8]
Exception in thread Thread-3:
Traceback (most recent call last):
  File "/usr/lib/python3.6/threading.py", line 916, in _bootstrap_inner
    self.run()
  File "/usr/lib/python3.6/threading.py", line 864, in run
    self._target(*self._args, **self._kwargs)
  File "/usr/lib/python3.6/multiprocessing/pool.py", line 489, in _handle_results
    task = get()
  File "/usr/lib/python3.6/multiprocessing/connection.py", line 251, in recv
    return _ForkingPickler.loads(buf.getbuffer())
  File "cupy/cuda/runtime.pyx", line 126, in cupy.cuda.runtime.CUDARuntimeError.__init__
TypeError: an integer is required
Run Code Online (Sandbox Code Playgroud)

另外,代码冻结并且不退出,但我认为它与 cupy 无关。

我的配置是这样的:

CuPy Version          : 5.2.0
CUDA Root             : /usr/local/cuda-10.0
CUDA Build Version    : 10000
CUDA Driver Version   : 10000
CUDA Runtime Version  : 10000
cuDNN Build Version   : 7301
cuDNN Version         : 7301
NCCL Build Version    : 2307
Run Code Online (Sandbox Code Playgroud)

kma*_*shi 6

此问题并非 CuPy 特有的。由于CUDA的限制,CUDA初始化后无法fork进程。

您需要使用multiprocessing.set_start_method('spawn')(或forkserver),或避免初始化 CUDA(即,不要使用 CuPy API,除非import cupy),直到您派生子进程。