我正在做一个数据不平衡的项目。我想使用随机欠采样来平衡数据。我很困惑是否应该在测试列车分割后进行欠采样,或者我应该先进行欠采样,然后再进行列车测试分割?
我的方法:
我的做法正确吗?如果我错了,请纠正我。
machine-learning resampling train-test-split
machine-learning ×1
resampling ×1
train-test-split ×1