小编Han*_*taa的帖子

我stratify在train_test_split()scikit-learn函数中的参数有问题。这是一个具有相同问题的虚拟示例，该问题随机出现在我的数据上：

from sklearn.model_selection import train_test_split
a = [1, 0, 0, 0, 0, 0, 0, 1]
train_test_split(a, stratify=a, random_state=42)

[[1, 0, 0, 0, 0, 1], [0, 0]]

它不应该在测试子集中也选择“ 1”吗？从我多么希望train_test_split()有stratify工作就应该返回类似：

[[1, 0, 0, 0, 0, 0], [0, 1]]

对于某些值，会发生这种情况random_state，而对于其他值，它会正常工作；但是我每次必须分析数据时都无法搜索它的“正确”值。

我有python 2.7和scikit-learn 0.18。

2
推荐指数

1
解决办法

3076
查看次数

小编Han_taa的帖子