相关疑难解决方法(0)

如何将数据分成3组(训练,验证和测试)?

我有一个熊猫数据帧,我希望把它分成3组.我知道使用train_test_splitsklearn.cross_validation,一个可以在两个集(训练集和测试)分割数据.但是,我找不到任何关于将数据拆分为三组的解决方案.最好,我想拥有原始数据的索引.

我知道解决方法是使用train_test_split两次并以某种方式调整索引.但有没有更标准/内置的方法将数据分成3组而不是2组?

numpy machine-learning dataframe pandas scikit-learn

112
推荐指数
4
解决办法
6万
查看次数

在scikit-learn中分层训练/测试分裂

我需要将我的数据分成训练集(75%)和测试集(25%).我目前使用以下代码执行此操作:

X, Xt, userInfo, userInfo_train = sklearn.cross_validation.train_test_split(X, userInfo)   
Run Code Online (Sandbox Code Playgroud)

但是,我想对训练数据集进行分层.我怎么做?我一直在研究这种StratifiedKFold方法,但是不允许我指定75%/ 25%的分割,只对训练数据集进行分层.

python scikit-learn

64
推荐指数
5
解决办法
10万
查看次数