字符串中的 Pandas read_csv EOF 从行开始

Bos*_*jan 2 python eof pandas

我正面临熊猫 read_csv 的问题。我有一个文件,其中包含 " 作为字段值。实际上,情况并非如此,但我对文件生成没有影响,因此我必须找到解决方法。

pandas.errors.ParserError:标记数据时出错。C 错误:从第 15345 行开始的字符串内的 EOF

我在 Git 上找到了一个关于这个的问题报告(链接在这里),他们建议使用用于“sep”参数的分隔符也用于“quotechar”。在这种情况下,文件结构会混乱。

我做的另一件事是为此添加一个例外,它将运行其余文件的代码,但我将继续遇到该特定类型文件的问题。

我用来读取 CSV 文件的命令:

df_new = pd.read_csv(file_path_name, sep=";", error_bad_lines=False)
Run Code Online (Sandbox Code Playgroud)

对此有什么解决方法的想法(例如忽略此问题的行)?我猜的一种方法是使用 csv 库来删除该行(或用其他东西替换 " ),但我想保持简单并在大熊猫中尽可能多地做。

Python版本:3.6.2

熊猫版本:0.21.0

感谢你并致以真诚的问候

Bos*_*jan 5

只想指出@user8505495 的建议有效(再次感谢您)。

基本上只是将参数添加quoting=3read_csv. 在to_csv起因和错误中使用相同的参数(缺少转义字符)。一种选择是设置escapechar参数,或者只是不使用quoting参数。