pandas read_csv() 中的引用参数

gau*_*207 6 python csv pandas

我正在使用pandas.read_csv(),我发现quotechar并引用了其中的参数,

pandas.read_csv(filepath_or_buffer, sep=', ' , quotechar='"', quoting=0) 
Run Code Online (Sandbox Code Playgroud)

这些参数的确切用途是什么?我查看了文档,但我无法理解。

EdC*_*ica 5

它用于处理多字符串数据:

In [39]:
data = {"strings": ["string", "string,string"],
        "int": np.arange(2),
        "float": np.random.randn(2)}
?
df = pd.DataFrame(data)
df

Out[39]:
      float  int        strings
0  0.116076    0         string
1 -0.316229    1  string,string

In [40]:    
df.to_csv(quotechar="'")

Out[40]:
",float,int,strings\n0,0.11607600924932446,0,string\n1,-0.31622948240636567,1,'string,string'\n"
Run Code Online (Sandbox Code Playgroud)

您可以看到string,string引用为:

'string,string'
Run Code Online (Sandbox Code Playgroud)

写入 csv 时

虽然第一个字符串是单独留下的。

默认引号字符是双引号:

In [41]:
df.to_csv()

Out[41]:
',float,int,strings\n0,0.11607600924932446,0,string\n1,-0.31622948240636567,1,"string,string"\n'
Run Code Online (Sandbox Code Playgroud)

多字符串条目写出为:

"string,string"
Run Code Online (Sandbox Code Playgroud)