在R中构建分类树时,如何解释因子变量的rpart拆分?

use*_*537 6 r rpart cart-analysis

如果因子变量是气候,有4个可能的值:热带,干旱,温带,雪和我rpart树中的节点标记为"气候:ab",分裂是什么?

Mar*_*rek 9

我假设您使用标准方式绘制树

plot(f)
text(f)
Run Code Online (Sandbox Code Playgroud)

正如你可以帮助阅读text.rpart,参数pretty上默认因子变量采用信件,所以a手段levels(Climate)[1],它意味着剩余节点上的观察Climate==levels(Climate)[1]和对权利的人.

您可以直接使用打印级别

plot(f)
text(f, pretty=1)
Run Code Online (Sandbox Code Playgroud)

由rpart创建

但我建议使用draw.tree来自maptree包:

require(maptree)
draw.tree(f)
Run Code Online (Sandbox Code Playgroud)

由maptree创建

我使用虚假数据做图:

X <- data.frame(
    y=rep(1:4,25),
    Climate=rep(c("Tropical", "Arid", "Temperate", "Snow"),25)
)
f <- rpart(y~Climate, X)
Run Code Online (Sandbox Code Playgroud)