Dem*_*nov 34 python parallel-processing multiprocessing
我正在用Python做一个机器学习项目,所以我必须做并行预测功能,我在我的程序中使用它.
from multiprocessing.dummy import Pool
from multiprocessing import cpu_count
def multi_predict(X, predict, *args, **kwargs):
pool = Pool(cpu_count())
results = pool.map(predict, X)
pool.close()
pool.join()
return results
Run Code Online (Sandbox Code Playgroud)
问题是我所有的CPU只加载了20-40%(总计为100%).我使用multiprocessing.dummy,因为我在pickling函数中遇到了多处理模块的问题.
dan*_*ano 66
使用时multiprocessing.dummy,您使用的是线程,而不是进程:
multiprocessing.dummy复制APImultiprocessing但只不过是threading模块的包装器.
这意味着您受全局解释器锁(GIL)的限制,并且一次只能有一个线程实际执行CPU绑定操作.这将使您无法充分利用您的CPU.如果您希望在所有可用内核中获得完全并行性,那么您将需要解决您遇到的酸洗问题multiprocessing.Pool.
请注意,multiprocessing.dummy如果您需要并行化的工作是IO绑定,或者使用释放GIL的C扩展,则可能仍然有用.但是,对于纯Python代码,您需要multiprocessing.
| 归档时间: |
|
| 查看次数: |
24781 次 |
| 最近记录: |