相关疑难解决方法(0)

csv中的双引号元素不能用pandas读取

我有一个输入文件,其中每个值都存储为字符串.它位于一个csv文件中,每个条目都在双引号内.

示例文件:

"column1","column2", "column3", "column4", "column5", "column6"
"AM", "07", "1", "SD", "SD", "CR"
"AM", "08", "1,2,3", "PR,SD,SD", "PR,SD,SD", "PR,SD,SD"
"AM", "01", "2", "SD", "SD", "SD"
Run Code Online (Sandbox Code Playgroud)

只有六列.我需要输入哪些选项来pandas read_csv才能正确读取?

我目前正在尝试:

import pandas as pd
df = pd.read_csv(file, quotechar='"')
Run Code Online (Sandbox Code Playgroud)

但这给了我错误信息: CParserError: Error tokenizing data. C error: Expected 6 fields in line 3, saw 14

这显然意味着它忽略了'''并将每个逗号解析为一个字段.但是,对于第3行,第3列到第6列应该是包含逗号的字符串.("1,2,3","PR,SD ,SD","PR,SD,SD","PR,SD,SD")

如何让pandas.read_csv正确解析?

谢谢.

python csv pandas

16
推荐指数
1
解决办法
2万
查看次数

pandas在列中使用额外的逗号读取csv

我正在读一个基本的csv文件,其中列用逗号分隔,并带有以下列名:

userid, username, body

但是,body列是一个可能包含逗号的字符串.显然这会导致问题,并且大熊猫会抛出错误:

CParserError: Error tokenizing data. C error: Expected 3 fields in line 3, saw 8

有没有办法告诉大熊猫忽略特定列中的逗号或解决此问题的方法?

python csv pandas

11
推荐指数
3
解决办法
2万
查看次数

标签 统计

csv ×2

pandas ×2

python ×2