如何通过 pandas dataframe 读取包含 utf-8 值的 .csv 文件

Cli*_*cal 6 csv utf-8 python-3.x pandas

我正在尝试读取某些列中包含 utf-8 数据的 .csv 文件。读取的方法是使用pandas dataframe。代码如下:

df = pd.read_csv('Cancer_training.csv', encoding='utf-8')
Run Code Online (Sandbox Code Playgroud)

然后我得到了以下不同文件的错误示例:

(1) 'utf-8' 编解码器无法解码位置 14 中的字节 0xcf:无效的连续字节

(2) 'utf-8' 编解码器无法解码位置 3 中的字节 0xc9:无效的连续字节

您能分享一下您对此类问题的想法和经验吗?谢谢。

[蟒蛇:3.4.1.final.0,熊猫:0.14.1]

原始数据样本,由于医疗数据的法律限制,我无法完整记录:

在此输入图像描述

lrh*_*h09 4

我无缘无故地遇到了这个问题,我设法使用以下方法让它工作:

df = pd.read_csv('file', encoding = "ISO-8859-1")
Run Code Online (Sandbox Code Playgroud)

不知道为什么