相关疑难解决方法(0)

如何将数据集拆分为类之间的训练和验证集保持比率?

我有一个多类分类问题,我的数据集是倾斜的,我有一个特定类的100个实例,并说一些不同类的10个,所以我想在类之间拆分我的数据集保持比例,如果我有100个特定类的实例我希望30%的记录进入训练集我希望有30个实例,我的100个记录代表类,3个实例代表我的10个记录,等等.

python numpy machine-learning pandas scikit-learn

14
推荐指数
2
解决办法
2万
查看次数

标签 统计

machine-learning ×1

numpy ×1

pandas ×1

python ×1

scikit-learn ×1