Python中的multiprocessing.dummy没有使用100%的cpu

Dem*_*nov 34 python parallel-processing multiprocessing

我正在用Python做一个机器学习项目,所以我必须做并行预测功能,我在我的程序中使用它.

from multiprocessing.dummy import Pool
from multiprocessing import cpu_count


def multi_predict(X, predict, *args, **kwargs):
    pool = Pool(cpu_count())
    results = pool.map(predict, X)
    pool.close()
    pool.join()
    return results
Run Code Online (Sandbox Code Playgroud)

问题是我所有的CPU只加载了20-40%(总计为100%).我使用multiprocessing.dummy,因为我在pickling函数中遇到了多处理模块的问题.

dan*_*ano 66

使用时multiprocessing.dummy,您使用的是线程,而不是进程:

multiprocessing.dummy复制API multiprocessing但只不过是threading模块的包装器.

这意味着您受全局解释器锁(GIL)的限制,并且一次只能有一个线程实际执行CPU绑定操作.这将使您无法充分利用您的CPU.如果您希望在所有可用内核中获得完全并行性,那么您将需要解决您遇到的酸洗问题multiprocessing.Pool.

请注意,multiprocessing.dummy如果您需要并行化的工作是IO绑定,或者使用释放GIL的C扩展,则可能仍然有用.但是,对于纯Python代码,您需要multiprocessing.

  • [Python线程是真正的OS线程:它们可以并行运行(如果有多个CPU核心).只有纯Python代码受GIL限制.C扩展名如`lxml`,`regex`,`numpy`可以并且确实释放GIL,因此可以并行运行多个线程.](http://stackoverflow.com/questions/26234301/synchronise-muti-threads -in-蟒蛇#comment41151656_26234761) (19认同)
  • @endolith:谁知道。可能有很多原因。问题中没有足够的信息。注意:在我发表评论时,答案甚至没有提到可以发布GIL。假设* all *性能问题归因于具有多个线程的Python程序中的GIL是错误的。 (3认同)
  • 或者使用非基于 GIL 的 Python 实现,如 Jython 或 IronPython……或者从 2015 年导入 PyPy 的无 GIL STM 版本。:) (2认同)