目前,我正在Sklearn中为我的不平衡数据实现RandomForestClassifier。我不太清楚RF在Sklearn中的工作原理。我的担心如下:
以下是Sklearn中RandomForestClassifier的描述。
“随机森林是一种元估计量,它适合数据集各个子样本上的许多决策树分类器,并使用平均数来提高预测准确性和控制过度拟合。子样本大小始终与原始样本大小相同。输入样本大小,但是如果bootstrap = True(默认值),则用替换绘制样本。”
在这里我之前找到了类似的问题。但是这个问题的答案并不多。
SciKit-Learn随机森林子样本大小如何等于原始训练数据大小?
谢谢!程