将数据框保存和加载到csv会导致未命名的列

Question

将数据框保存和加载到csv会导致未命名的列

标题中的概率.的exaple:

x=[('a','a','c') for i in range(5)]
df = DataFrame(x,columns=['col1','col2','col3'])
df.to_csv('test.csv')
df1 = read_csv('test.csv')

   Unnamed: 0 col1 col2 col3
0           0    a    a    c
1           1    a    a    c
2           2    a    a    c
3           3    a    a    c
4           4    a    a    c

Run Code Online (Sandbox Code Playgroud)

原因似乎是在保存数据帧时,也会写入索引列,标题中没有名称.然后当您再次加载csv时,它将索引列作为未命名列加载.这是一个错误吗？如何避免使用索引编写csv,或者在读取时删除未命名的列？

Answer 1

Max*_*Max 8

您可以通过to_csv的index和index_label 参数删除行标签.

Answer 2

Jef*_*eff 5

由于位置原因，csv格式中存在歧义，因此它们不是对称的。您需要指定一个index_col回读

In [1]: x=[('a','a','c') for i in range(5)]

In [2]: df = DataFrame(x,columns=['col1','col2','col3'])

In [3]: df.to_csv('test.csv')

In [4]: !cat test.csv
,col1,col2,col3
0,a,a,c
1,a,a,c
2,a,a,c
3,a,a,c
4,a,a,c

In [5]: pd.read_csv('test.csv',index_col=0)
Out[5]: 
  col1 col2 col3
0    a    a    c
1    a    a    c
2    a    a    c
3    a    a    c
4    a    a    c

Run Code Online (Sandbox Code Playgroud)

这看起来与上面非常相似，所以'foo'是列还是索引？

In [6]: df.index.name = 'foo'

In [7]: df.to_csv('test.csv')

In [8]: !cat test.csv
foo,col1,col2,col3
0,a,a,c
1,a,a,c
2,a,a,c
3,a,a,c
4,a,a,c

Run Code Online (Sandbox Code Playgroud)

归档时间：	12 年，1 月前
查看次数：	9159 次
最近记录：	8 年，7 月前