数据帧编码

BKS*_*BKS 5 dataframe python-2.7 pandas

有没有办法编码我的数据帧的索引?我有一个数据框,索引是国际会议的名称.

df2= pd.DataFrame(index=df_conf['Conference'], columns=['Citation1991','Citation1992'])

我一直在: KeyError: 'Leitf\xc3\xa4den der angewandten Informatik'

每当我的代码引用具有未知ascii字母的外国会议名称时.

我试过了:

df.at[x.encode("utf-8"), 'col1']

df.at[x.encode('ascii', 'ignore'), 'col']
Run Code Online (Sandbox Code Playgroud)

有办法解决吗?我试着看看我是否可以在创建时对数据帧进行编码,但似乎我也无法做到.

Gui*_*not 10

使用该选项读取输入文件时应该处理设置编码 encoding

df = pd.read_csv('bibliography.csv', delimiter=',', encoding="utf-8")
Run Code Online (Sandbox Code Playgroud)

或者如果文件使用BOM,

df = pd.read_csv('bibliography.csv', delimiter=',', encoding="utf-8-sig")
Run Code Online (Sandbox Code Playgroud)

  • 我实际上在发布之前就已经看过了,但它并没有帮助我,因为我不是很遗憾地读取csv.我正在阅读sql评论.所以我正在使用pd.read_sql().有帮助吗? (3认同)

BKS*_*BKS 9

如果您没有使用csv,并且想要对字符串索引进行编码,那么这对我有用:

df.index = df.index.str.encode('utf-8')
Run Code Online (Sandbox Code Playgroud)