sklearn中min_impurity_decrease的定义是
如果此分裂导致杂质减少大于或等于该值,则该节点将被分裂。
使用 Iris 数据集,并设置 min_impurity_decrease = 0.0
当 min_impurity_decrease = 0.0 时树的外观
设置 min_impurity_decrease = 0.1,我们将得到:
当 min_impurity_decrease = 0.1 时树的外观
看绿色方块,其中基尼指数(杂质)= 0.2041,为什么我们放min_impurity_decrease = 0.1时它没有分裂,尽管基尼指数(杂质)左= 0.0,基尼指数(杂质)右= 0.375
这是否意味着修剪所有子节点,修剪后,它们的父节点基尼指数将小于 0.1 ?因为,如果是这种情况,那么为什么我们不修剪具有大于 0.1 的 gini = 0.487) 的第二级节点?