如何修复熊猫 csv 阅读器上的“错误标记数据”?

use*_*983 5 python csv tokenize pandas

我正在尝试使用 Pandas 读取 csv 文件。

该文件实际上只有一行,但是每当我尝试读取它时都会导致错误。

第 8 行似乎发生了错误,但我几乎找不到第 8 行,因为上面显然只有一行。

我喜欢:

with codecs.open("path_to_file", "rU", "Shift-JIS", "ignore") as file:

df = pd.read_csv(file, header=None, sep="\t")
df
Run Code Online (Sandbox Code Playgroud)

然后我得到:

ParserError: Error tokenizing data. C error: Expected 1 fields in line 8, saw 3

我不明白到底发生了什么,所以你的任何建议将不胜感激。

小智 6

尝试df = pd.read_csv(file, header=None, error_bad_lines=False)


Hie*_*mar 6

我为此苦苦挣扎了将近半天,我用记事本打开了 csv 并注意到分隔符是 TAB 而不是逗号,然后尝试了 belo 组合。

df = pd.read_csv('C:\\myfile.csv',sep='\t', lineterminator='\r')
Run Code Online (Sandbox Code Playgroud)