DecisionTreeClassifier与ExtraTreeClassifier

dra*_*oon 8 decision-tree scikit-learn

我试图弄清楚scikit-learn包中的哪种决策树方法更适合我执行分类任务的需要.

但是,我发现有两种决策树模型可用:

  • 标准DecisionTreeClassifier基于scikit.tree包的优化CART算法.
  • 来自scikit.ensemble包的集合方法ExtraTreeClassifier.

任何人都可以指出使用这些模型的优点和缺点吗?

ogr*_*sel 15

ExtraTreeClassifier是一个非常随机的版本,DecisionTreeClassifier意在内部用作整体的一部分ExtraTreesClassifier.

平均合奏RandomForestClassifierExtraTreesClassifier旨在解决问题的方差(缺乏健壮性相对于训练集中的微小变化)个人的DecisionTreeClassifier实例.

如果您的主要目标是最大化预测准确性,那么您几乎应该总是使用一组决策树,例如ExtraTreesClassifier(或者增强整体),而不是训练单个决策树.

有关详细信息,请查看原始的Extra Trees纸张.