可以在决策树中多次出现"拆分属性"吗?

yve*_*owe 5 machine-learning data-mining decision-tree

只想澄清一件事:只要它们处于不同的"分支"中,相同的属性可以多次出现在决策树中吗?

Ano*_*sse 7

出于显而易见的原因,在同一分支中使用相同的决策是没有意义的.

在不同的分支上,这种推理显然不成立.

考虑经典的XOR(x,y)问题.您可以使用两层决策树来解决它,但是您需要在两个分支中拆分相同的属性.

If x is true:
    If y is true:  return false
    If y is false: return true
If x is false:
    If y is true:  return true
    If y is false: return false
Run Code Online (Sandbox Code Playgroud)

另一个例子如下:假设您的数据在x = [0; 1]中是正数,在外部是负数.一棵好树将如下:

If x > 1:      return negative
If x <= 1:
    If x >= 0: return positive
    If x < 0:  return negative
Run Code Online (Sandbox Code Playgroud)

这不是同一个决定,因此使用x两次是有意义的.


sas*_*llo 6

  1. 一般来说,只要你保持"树"的结构,你就可以做任何你想做的事.它们可以通过多种方式进行定制,虽然可以实现冗余,但不会破坏其有效性.

  2. 二进制属性不应该在同一个早午餐中出现两次,这将是多余的.但是,连续属性可以多次出现在同一分支中.