火花决策树中使用了什么算法(ID3,C4.5或CART)

zhu*_*xue 8 tree apache-spark

我对决策树有疑问MLlib.Spark中使用了什么算法?是ID3,C4.5还是CART?

小智 1

如果您查看链接Apache Spark并查看该部分,

节点杂质和信息增益(基本算法)

你可以找到

当前的实现提供了两种用于分类的杂质度量(基尼杂质和熵)和一种用于回归的杂质度量(方差)

另外,如果您查看链接决策树,您可以发现 CART(分类和回归树)算法使用基尼杂质和熵进行分类,并使用方差减少进行回归。