我在分析中使用了分类决策树。首先,我将整个数据分为训练和测试 - 60%:40%。然后我在训练集上使用 GridSearch 来获得最佳评分模型 (max_深度 = 7)。然后我在交叉验证集和训练集上绘制了学习曲线。这是我得到的图表。看起来两条线是重叠的。那么它告诉我什么?我的模型没有过度拟合吗?一般来说,为什么我们在分析中需要学习曲线?
链接到我的学习曲线图片
多谢!
decision-tree grid-search
decision-tree ×1
grid-search ×1