ava*_*vaj 7 python recommendation-engine machine-learning pandas data-science
我有这个代码,我想从文件中删除列'timestamp':u.data但不能.它显示错误
"ValueError:labels ['timestamp']未包含在轴中"我如何纠正它
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.rc("font", size=14)
from sklearn.linear_model import LinearRegression
from sklearn.linear_model import Ridge
from sklearn.cross_validation import KFold
from sklearn.cross_validation import train_test_split
data = pd.read_table('u.data')
data.columns=['userID', 'itemID','rating', 'timestamp']
data.drop('timestamp', axis=1)
N = len(data)
print data.shape
print list(data.columns)
print data.head(10)
Run Code Online (Sandbox Code Playgroud)
面临的最大问题之一是,在u.data文件中插入标头时,分隔应该与一行数据之间的分隔完全相同。例如,如果使用制表符分隔元组,则不应使用空格。
在您的u.data文件中,添加标头,并使用行中各项目之间使用的空白将它们完全分隔开。附言:使用崇高的文字,notepad / notepad ++有时不起作用。
| 归档时间: |
|
| 查看次数: |
16716 次 |
| 最近记录: |