Hel*_*lia 0 parallel-processing r missing-data imputation
我正在输入缺失值,missRanger因为我有 1000 个变量,所以花费的时间太长。我尝试使用并行计算,但它并没有使过程更快。这是代码
library(doParallel)
cores=detectCores()
cl <- makeCluster(cores[1]-1)
registerDoParallel(cl)
library(missRanger)
train[1:lengthvar] <- missRanger(train[1:lengthvar], pmm.k = 3, num.trees = 100)
stopCluster(cl)
Run Code Online (Sandbox Code Playgroud)
我不确定要向此代码添加什么才能使其正常工作。
missRanger基于 R - 中的并行化随机森林实现ranger。因此,代码已经在所有内核上运行,并且doParallel只会使代码变得笨拙。
尝试通过将相关参数传递给rangervia ...of的参数来加速计算missRanger,例如
num.trees = 20 或者
max.depth = 8
反而。
免责声明:我是missRanger.