相关疑难解决方法(0)

Scikit-learn train_test_split带索引

使用train_test_split()时如何获取数据的原始索引?

我所拥有的是以下内容

from sklearn.cross_validation import train_test_split
import numpy as np
data = np.reshape(np.randn(20),(10,2)) # 10 training examples
labels = np.random.randint(2, size=10) # 10 labels
x1, x2, y1, y2 = train_test_split(data, labels, size=0.2)
Run Code Online (Sandbox Code Playgroud)

但这并没有给出原始数据的索引.一种解决方法是将索引添加到数据(例如data = [(i, d) for i, d in enumerate(data)]),然后将其传递到内部train_test_split,然后再次展开.有没有更清洁的解决方案?

python classification scipy scikit-learn

48
推荐指数
3
解决办法
8万
查看次数

标签 统计

classification ×1

python ×1

scikit-learn ×1

scipy ×1