如何在缺失值的插补中对missRanger使用并行计算?

Hel*_*lia 0 parallel-processing r missing-data imputation

我正在输入缺失值,missRanger因为我有 1000 个变量,所以花费的时间太长。我尝试使用并行计算,但它并没有使过程更快。这是代码

library(doParallel)
cores=detectCores()
cl <- makeCluster(cores[1]-1) 
registerDoParallel(cl)
library(missRanger)
train[1:lengthvar] <- missRanger(train[1:lengthvar], pmm.k = 3, num.trees = 100)
stopCluster(cl)
Run Code Online (Sandbox Code Playgroud)

我不确定要向此代码添加什么才能使其正常工作。

Mic*_*l M 5

missRanger基于 R - 中的并行化随机森林实现ranger。因此,代码已经在所有内核上运行,并且doParallel只会使代码变得笨拙。

尝试通过将相关参数传递给rangervia ...of的参数来加速计算missRanger,例如

  • num.trees = 20 或者

  • max.depth = 8

反而。

免责声明:我是missRanger.