df_track = pd.read_csv(E:/my_python/project_2/tracks.csv)
df_tracks.head()
Run Code Online (Sandbox Code Playgroud)
这是我的代码,在执行时出现错误
“utf-8”编解码器无法解码位置 201994 中的字节 0xed:无效的连续字节
该错误意味着您的文件不是 UTF-8(常见的默认编码)。也许它是一个混合编码文件。
正如您可以在文档中查看:https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html,您有一个encoding参数来指定不同的编码,并且您有一个指向支持的列表的链接编码。尝试使用latin1. 如果文件较旧,您应该猜测编码(这取决于国家/地区、操作系统等)。
所以尝试添加, encoding='latin1'到您的read_csv(). 它不会失败(如给您一条错误消息):该编码器可以解码所有字节序列。只是它可能会给出错误的字符,在这种情况下尝试其他编码(在上述文档的链接中列出read_csv),直到文本看起来到处都是正确的。
其他常见编码:cp1252(Windows 中西方语言常见)、mbcs(仅适用于 Windows,它是臭名昭著的Windows ANSI)、cp437(旧 IBM PC)、mac_roman旧 mac(西方语言)。
编辑:latin1Python 中似乎是一个更好的解决方案,并添加了常见编码的列表。