obo*_*obo 5 python csv tuples pandas
使用pandas,我已经向csv文件导出了一个数据帧,其单元格包含字符串元组.生成的文件具有以下结构:
index,colA
1,"('a','b')"
2,"('c','d')"
Run Code Online (Sandbox Code Playgroud)
现在我想用read_csv读回来.无论我尝试什么,pandas都会将值解释为字符串而不是元组.例如:
In []: import pandas as pd
df = pd.read_csv('test',index_col='index',dtype={'colA':tuple})
df.loc[1,'colA']
Out[]: "('a','b')"
Run Code Online (Sandbox Code Playgroud)
有没有办法告诉大熊猫做正确的事情?优选地,不对数据帧进行大量后处理:实际表具有5000行和2500列.
DSM*_*DSM 11
将元组存储在列中通常不是一个好主意; 使用Series和DataFrames的许多优点都会丢失.也就是说,您可以使用converters后处理字符串:
>>> df = pd.read_csv("sillytup.csv", converters={"colA": ast.literal_eval})
>>> df
index colA
0 1 (a, b)
1 2 (c, d)
[2 rows x 2 columns]
>>> df.colA.iloc[0]
('a', 'b')
>>> type(df.colA.iloc[0])
<type 'tuple'>
Run Code Online (Sandbox Code Playgroud)
但我可能会在源头改变一切,以避免首先存储元组.
| 归档时间: |
|
| 查看次数: |
3861 次 |
| 最近记录: |