gio*_*o79 2 csv machine-learning dataset scikit-learn
我有一个数组,其中第一列是类(整数形式),其余列是特征。
SG 喜欢这样
1,0,34,23,2
0,0,21,11,0
3,11,2,11,1
Run Code Online (Sandbox Code Playgroud)
如何将其转换为 scikit 兼容的数据集,以便我可以像 mydataset = datasets.load_mydataset() 那样调用 sg?
小智 5
您可以简单地使用熊猫。例如,如果您已将数据集复制到 dataset.csv 文件。只需适当地标记 csv 文件中的列即可。
In [1]: import pandas as pd
In [2]: df = pd.read_csv('temp.csv')
In [3]: df
Out[3]:
Label f1 f2 f3 f4
0 1 0 34 23 2
1 0 0 21 11 0
2 3 11 2 11 1
In [4]: y_train= df['Label']
In [5]: x_train = df.drop('Label', axis=1)
In [6]: x_train
Out[6]:
f1 f2 f3 f4
0 0 34 23 2
1 0 21 11 0
2 11 2 11 1
In [7]: y_train
Out[7]:
0 1
1 0
2 3
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
7967 次 |
| 最近记录: |