在阅读了随机欠采样、随机过采样和SMOTE 之后,我试图了解 SKlearn 包中用于逻辑回归或随机森林的默认实现使用什么方法。我在这里检查了文档
所述均衡模式使用y的值来自动调节权重成反比的输入数据作为类频率N_SAMPLES次/(n_classes * np.bincount(Y))
我无法在样本多数类或样本少数类下理解它来创建平衡集
python sampling random-forest scikit-learn logistic-regression
logistic-regression ×1
python ×1
random-forest ×1
sampling ×1
scikit-learn ×1