我如何分发minibatch kmeans(scikit-learn)的处理?

Phy*_*win 6 python machine-learning multiprocessing scikit-learn

在Scikit-learn中,K-Means有n_jobs,但MiniBatch K-Means缺乏它.MBK比KMeans快,但在大型样本集中,我们希望它跨多处理(或其他并行处理库)分配处理.

MKB的部分适合答案吗?

And*_*ler 3

我认为这是不可能的。您可以在小批量处理中使用 OpenMP 实现某些功能。我不知道有任何并行小批量 k 均值程序。并行化随机梯度下降过程有点棘手。

顺便说一句,KMeans 中的 n_jobs 参数仅分布不同的随机初始化。