Orv*_*var 6 python excel utf-8 pandas
我和Pandas和Excel有很大的问题.我在Excel文档中读入数据帧,这很好.我做计算,一切都很顺利.然后我尝试保存数据帧以检查计算结果,并且pandas爆炸了这个错误消息:
UnicodeEncodeError: 'ascii' codec can't encode character u'\xf3' in position 4: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)
这通常表明数据帧中的某些单元格中存在一些非ascii字符.我通常的方法是删除该列,因为我只想分析数字,而不是字符串.
但是,我应该删除哪一列?我没有线索.理想情况下,我想让大熊猫告诉我哪些细胞有问题,或哪些列有问题.截至目前,熊猫不要告诉我任何事情,所以我需要手动检查每个细胞以找到罪魁祸首.我所做的是打印出坏字符,并手动检查每个单元格中的打印字符.这是不可行的.所以我删除所有不可行的字符串列.如何解决这个问题呢?如何找到单元格或列,这会给我带来不良字符的问题?
我试图将所有东西都转换成utf-8,夹心等等,但我无法让它工作.所以我需要一种方法来找到有问题的单元格,以便我可以手动删除字符串.
编辑:解决了!正如bdiamante建议的那样,他的链接显示了这个问题的解决方案.为了将来参考,这适用:
df.to_csv('file.csv',encoding='utf-8-sig')
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
3985 次 |
| 最近记录: |