我从一些传感器测量值和一些标签创建了一个数据集,并对其进行了一些分类,结果很好。但是,由于我的数据集中的数据量相对较小(1400 个示例),我想根据这些数据生成更多数据。我的数据集中的每一行都包含 32 个数值和一个标签。
根据我拥有的现有数据集生成更多数据的最佳方法是什么?到目前为止,我已经研究了生成对抗网络和自动编码器,但我认为这种方法不适合我的情况。
到目前为止,我一直在 Scikit-learn 工作,但我也可以使用其他库。
python machine-learning dataset scikit-learn
dataset ×1
machine-learning ×1
python ×1
scikit-learn ×1