“Utf-8”编解码器无法解码字节 0xed

Question

“Utf-8”编解码器无法解码字节 0xed

df_track = pd.read_csv(E:/my_python/project_2/tracks.csv)
df_tracks.head()

Run Code Online (Sandbox Code Playgroud)

这是我的代码，在执行时出现错误

“utf-8”编解码器无法解码位置 201994 中的字节 0xed：无效的连续字节

Answer 1

Gia*_*zzi 6

该错误意味着您的文件不是 UTF-8（常见的默认编码）。也许它是一个混合编码文件。

正如您可以在文档中查看：https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html，您有一个encoding参数来指定不同的编码，并且您有一个指向支持的列表的链接编码。尝试使用latin1. 如果文件较旧，您应该猜测编码（这取决于国家/地区、操作系统等）。

所以尝试添加, encoding='latin1'到您的read_csv(). 它不会失败（如给您一条错误消息）：该编码器可以解码所有字节序列。只是它可能会给出错误的字符，在这种情况下尝试其他编码（在上述文档的链接中列出read_csv），直到文本看起来到处都是正确的。

其他常见编码：cp1252（Windows 中西方语言常见）、mbcs（仅适用于 Windows，它是臭名昭著的Windows ANSI）、cp437（旧 IBM PC）、mac_roman旧 mac（西方语言）。

编辑：latin1Python 中似乎是一个更好的解决方案，并添加了常见编码的列表。

归档时间：	3 年，10 月前
查看次数：	27465 次
最近记录：	3 年，10 月前