python pandas read_csv quotechar不起作用

rag*_*esz 3 python csv pandas

我已经读过这个,这个这个帖子但是我不知道为什么quotechar不起作用pd.read_csv()(Python 3,pandas 0.18.0和0.18.1).我怎么能读这样的数据帧:

"column1","column2", "column3", "column4", "column5", "column6"
"AM", 7, "1", "SD", "SD", "CR"
"AM", 8, "1,2 ,3", "PR, SD,SD", "PR ; , SD,SD", "PR , ,, SD ,SD"
"AM", 1, "2", "SD", "SD", "SD"
Run Code Online (Sandbox Code Playgroud)

我想要以下结果:

Out[116]: 
  column1  column2 column3    column4       column5        column6
0      AM        7       1         SD            SD             CR
1      AM        8  1,2 ,3  PR, SD,SD  PR ; , SD,SD  PR , ,, SD,SD
2      AM        1       2         SD            SD             SD
Run Code Online (Sandbox Code Playgroud)

谢谢!!

ptr*_*trj 13

关于分离器的熊猫文档read_csv():

超过1个字符且不同于'\ s +'的分隔符将被解释为正则表达式,将强制使用python解析引擎并忽略数据中的引号.

请尝试使用它(sep默认情况下设置为逗号):

pd.read_csv(file, skipinitialspace = True, quotechar = '"')
Run Code Online (Sandbox Code Playgroud)

  • 对我来说重要的一点是“skipinitialspace = True”,它忽略了分隔符之间的空格。OPs CSV 文件中的“错误”是逗号之间的空格,这显然不是 csv 的典型错误。 (2认同)