使用numpy将最后一列与实际数据集分开

Question

使用numpy将最后一列与实际数据集分开

我有一个csv格式（无标题）的数据集，我想将其分为两部分：（1）没有最后一列的实际数据集，（2）最后一列（类标签）。我的数据集具有10万行和65个特征（其中最后一列65列是我要分离的类标签）。我写了以下内容：

dataset_path = 'dataset.csv'

dataset = np.genfromtxt(dataset_path, delimiter=',')
class_label = dataset[:-1]
dataset.drop(class_label, axis=1, inplace=True)

print dataset.shape
print class_label

Run Code Online (Sandbox Code Playgroud)

这实际上是错误的。我无法实现我想要的。任何帮助表示赞赏。

Answer 1

ahe*_*d87 5

假设您的数据集没有标题

class_label = dataset[:, -1] # for last column
dataset = dataset[:, :-1] # for all but last column

Run Code Online (Sandbox Code Playgroud)

归档时间：	8 年前
查看次数：	2677 次
最近记录：	8 年前