我想设置dtype多列的s pd.Dataframe(我有一个文件,我必须手动解析到列表列表,因为该文件不适合pd.read_csv)
import pandas as pd
print pd.DataFrame([['a','1'],['b','2']],
dtype={'x':'object','y':'int'},
columns=['x','y'])
Run Code Online (Sandbox Code Playgroud)
我明白了
ValueError: entry not a 2- or 3- tuple
Run Code Online (Sandbox Code Playgroud)
我可以设置它们的唯一方法是循环遍历每个列变量并重铸astype.
dtypes = {'x':'object','y':'int'}
mydata = pd.DataFrame([['a','1'],['b','2']],
columns=['x','y'])
for c in mydata.columns:
mydata[c] = mydata[c].astype(dtypes[c])
print mydata['y'].dtype #=> int64
Run Code Online (Sandbox Code Playgroud)
有没有更好的办法?