如何创建 scikit learn 数据集？

Question

如何创建 scikit learn 数据集？

gio*_*o79 2 csv machine-learning dataset scikit-learn

我有一个数组，其中第一列是类（整数形式），其余列是特征。

SG 喜欢这样

1,0,34,23,2
0,0,21,11,0
3,11,2,11,1

Run Code Online (Sandbox Code Playgroud)

如何将其转换为 scikit 兼容的数据集，以便我可以像 mydataset = datasets.load_mydataset() 那样调用 sg？

Answer 1

小智 5

您可以简单地使用熊猫。例如，如果您已将数据集复制到 dataset.csv 文件。只需适当地标记 csv 文件中的列即可。

In [1]: import pandas as pd

In [2]: df = pd.read_csv('temp.csv')

In [3]: df
Out[3]: 
   Label  f1  f2  f3  f4
0      1   0  34  23   2
1      0   0  21  11   0
2      3  11   2  11   1

In [4]: y_train= df['Label']

In [5]: x_train = df.drop('Label', axis=1)

In [6]: x_train
Out[6]: 
   f1  f2  f3  f4
0   0  34  23   2
1   0  21  11   0
2  11   2  11   1

In [7]: y_train
Out[7]: 
0    1
1    0
2    3

Run Code Online (Sandbox Code Playgroud)

归档时间：	9 年，11 月前
查看次数：	7967 次
最近记录：	9 年，11 月前