使用numpy将最后一列与实际数据集分开

Med*_*edo 0 python numpy python-2.7

我有一个csv格式(无标题)的数据集,我想将其分为两部分:(1)没有最后一列的实际数据集,(2)最后一列(类标签)。我的数据集具有10万行和65个特征(其中最后一列65列是我要分离的类标签)。我写了以下内容:

dataset_path = 'dataset.csv'

dataset = np.genfromtxt(dataset_path, delimiter=',')
class_label = dataset[:-1]
dataset.drop(class_label, axis=1, inplace=True)

print dataset.shape
print class_label
Run Code Online (Sandbox Code Playgroud)

这实际上是错误的。我无法实现我想要的。任何帮助表示赞赏。

ahe*_*d87 5

假设您的数据集没有标题

class_label = dataset[:, -1] # for last column
dataset = dataset[:, :-1] # for all but last column
Run Code Online (Sandbox Code Playgroud)