读取包含Pandas中列表的csv

Fin*_*ist 11 python csv pandas

我正试图把这个csv读成大熊猫

HK,"[u'5328.1', u'5329.3', '2013-12-27 13:58:57.973614']"
HK,"[u'5328.1', u'5329.3', '2013-12-27 13:58:59.237387']"
HK,"[u'5328.1', u'5329.3', '2013-12-27 13:59:00.346325']"
Run Code Online (Sandbox Code Playgroud)

正如您所看到的,只有2列,第二列是列表,当使用带有参数的pd.read_csv()时,有没有办法正确解释它(意味着将列表中的值读取为列)?

谢谢

alk*_*lko 19

一种选择是ast.literal_eval用作转换器:

>>> import ast
>>> df = pd.read_clipboard(header=None, quotechar='"', sep=',', 
...                   converters={1:ast.literal_eval})
>>> df
    0                                             1
0  HK  [5328.1, 5329.3, 2013-12-27 13:58:57.973614]
1  HK  [5328.1, 5329.3, 2013-12-27 13:58:59.237387]
2  HK  [5328.1, 5329.3, 2013-12-27 13:59:00.346325]
Run Code Online (Sandbox Code Playgroud)

如果需要,将这些列表转换为DataFrame,例如:

>>> df = pd.DataFrame.from_records(df[1].tolist(), index=df[0],
...                           columns=list('ABC')).reset_index()
>>> df['C'] = pd.to_datetime(df['C'])
>>> df
    0       A       B                          C
0  HK  5328.1  5329.3 2013-12-27 13:58:57.973614
1  HK  5328.1  5329.3 2013-12-27 13:58:59.237387
2  HK  5328.1  5329.3 2013-12-27 13:59:00.346325
Run Code Online (Sandbox Code Playgroud)

  • @Ewan:真的对您有用吗?对我来说,它说:dtype <class'list'>不被理解 (2认同)

Sat*_*esh 6

df['new_column'] = df['column'].apply(lambda x: ast.literal_eval(x))
Run Code Online (Sandbox Code Playgroud)

只需在包含列表作为字符串的列上运行上面的代码。