yve*_*owe 5 machine-learning data-mining decision-tree
只想澄清一件事:只要它们处于不同的"分支"中,相同的属性可以多次出现在决策树中吗?
出于显而易见的原因,在同一分支中使用相同的决策是没有意义的.
在不同的分支上,这种推理显然不成立.
考虑经典的XOR(x,y)问题.您可以使用两层决策树来解决它,但是您需要在两个分支中拆分相同的属性.
If x is true:
If y is true: return false
If y is false: return true
If x is false:
If y is true: return true
If y is false: return false
Run Code Online (Sandbox Code Playgroud)
另一个例子如下:假设您的数据在x = [0; 1]中是正数,在外部是负数.一棵好树将如下:
If x > 1: return negative
If x <= 1:
If x >= 0: return positive
If x < 0: return negative
Run Code Online (Sandbox Code Playgroud)
这不是同一个决定,因此使用x两次是有意义的.
一般来说,只要你保持"树"的结构,你就可以做任何你想做的事.它们可以通过多种方式进行定制,虽然可以实现冗余,但不会破坏其有效性.
二进制属性不应该在同一个早午餐中出现两次,这将是多余的.但是,连续属性可以多次出现在同一分支中.