小编Bat*_*lak的帖子

R游侠包中的预测概率

我正在尝试使用随机森林分类在R中建立模型。(通过由奈德霍宁编辑代码)予先用随机森林包,但随后发现测距仪包,其中承诺更快的计算。

首先,我使用下面的代码来获取模型末尾每个类的预测概率:

predProbs <- as.data.frame(predict(randfor, imageBlock, type='prob'))
Run Code Online (Sandbox Code Playgroud)

这里的概率类型如下:

我们的模型中有500棵树,其中250棵表示观察为1类,因此概率为250/500 = 50%

Ranger中,我意识到没有type = 'prob'选择。

我搜索并尝试了一些调整,但没有任何进展。我需要一个包含上述Ranger软件包中所述概率的对象。

有人可以给这个问题一些建议吗?

r random-forest

2
推荐指数
1
解决办法
1056
查看次数

R 通过删除 NA 值聚合字符串

我有一个这样的 DF:

df_1 <- data_frame(
  id = c(1, 1, 2, 2, 3),
  Class1 = c("C1", NA, "C3", "C3", NA),
  Class2 = c(NA, "C2", NA, NA, "C4")
)
Run Code Online (Sandbox Code Playgroud)
> df_1
# A tibble: 5 x 3
     id Class1 Class2
  <dbl> <chr>  <chr> 
1     1 C1     NA    
2     1 NA     C2    
3     2 C3     NA    
4     2 C3     NA    
5     3 NA     C4 
Run Code Online (Sandbox Code Playgroud)

我需要一个最终输出:

> df_1
# A tibble: 5 x 3
     id Class1 Class2
  <dbl> <chr>  <chr> 
1     1 C1     C2 …
Run Code Online (Sandbox Code Playgroud)

r dplyr

1
推荐指数
1
解决办法
52
查看次数

标签 统计

r ×2

dplyr ×1

random-forest ×1