我正在尝试使用随机森林分类在R中建立模型。(通过由奈德霍宁编辑代码)予先用随机森林包,但随后发现测距仪包,其中承诺更快的计算。
首先,我使用下面的代码来获取模型末尾每个类的预测概率:
predProbs <- as.data.frame(predict(randfor, imageBlock, type='prob'))
Run Code Online (Sandbox Code Playgroud)
这里的概率类型如下:
我们的模型中有500棵树,其中250棵表示观察为1类,因此概率为250/500 = 50%
在Ranger中,我意识到没有type = 'prob'选择。
我搜索并尝试了一些调整,但没有任何进展。我需要一个包含上述Ranger软件包中所述概率的对象。
有人可以给这个问题一些建议吗?
我有一个这样的 DF:
df_1 <- data_frame(
id = c(1, 1, 2, 2, 3),
Class1 = c("C1", NA, "C3", "C3", NA),
Class2 = c(NA, "C2", NA, NA, "C4")
)
Run Code Online (Sandbox Code Playgroud)
> df_1
# A tibble: 5 x 3
id Class1 Class2
<dbl> <chr> <chr>
1 1 C1 NA
2 1 NA C2
3 2 C3 NA
4 2 C3 NA
5 3 NA C4
Run Code Online (Sandbox Code Playgroud)
我需要一个最终输出:
> df_1
# A tibble: 5 x 3
id Class1 Class2
<dbl> <chr> <chr>
1 1 C1 C2 …Run Code Online (Sandbox Code Playgroud)