Ant*_*na_ 3 python csv dataframe pandas
有一个带有三列数据框的 CSV 格式文件。第三列有很长的文字。当我尝试使用打开文件时出现此错误消息pandas.read_csv
message : UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 0: invalid start byte.
Run Code Online (Sandbox Code Playgroud)
但是打开文件没有问题
with open('file.csv', 'r', encoding='utf-8', errors = "ignore") as csvfile:
Run Code Online (Sandbox Code Playgroud)
我不知道如何将此数据转换为数据帧,我认为无法pandas.read_csv正确处理此错误。
那么,我如何打开这个文件并获取数据框?
小智 7
尝试这个:
在文本编辑器中打开 cvs 文件并确保将其保存为 utf-8 格式。
然后正常读取文件:
import pandas
csvfile = pandas.read_csv('file.csv', encoding='utf-8')
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
12472 次 |
| 最近记录: |