Fey*_*rov 1 python dictionary nested list pandas
我有一个字典列表l1,如下所示:
[{'A1': 'string',
'B1': {'ba': 'string',
'bb': 'string',
'bc': 'string',
'bd': 'string',
'be': 'string'},
'C1': {'ca': 'string',
'cb': [[[123,123],[123,123]]]},
'D1': 'string'},
...]
Run Code Online (Sandbox Code Playgroud)
某些字典(l1 元素)可能缺少一些键,例如,l1 的第二个列表元素可能没有'bc':''string'键/值对。
我需要将以下顶部和嵌套键/值元素提取到数据框中,如下所示:
bc bd cb D1
string string [[[123,123],[123,123]]] string
N/A string [[[123,123],[123,123]]] string
...
string N/A [[[123,123],[123,123]]] string
Run Code Online (Sandbox Code Playgroud)
我的代码如下:
temp_df = pd.DataFrame(columns = ['bc','bd','cb','D1']
for i in l1:
temp_df = temp_df.append({'bc': i.get(['B1']['bc'],'N/A'),
'bd': i.get(['B1']['bd'],'N/A'),
'cb': i.get(['C1']['cb'],'N/A'),
'D1': i.get(['D1'],'N/A')},
ignore_index=True)
Run Code Online (Sandbox Code Playgroud)
我收到的错误如下:
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-113-543c6addad42> in <module>
1 for i in l1:
----> 2 temp_df = temp_df.append({'bc': i.get(['B1']['bc'],'N/A'),
3 'bd': i.get(['B1']['bd'],'N/A'),
4 'C1': i.get(['C1']['cb'],'N/A'),
5 'D1': i.get(['D1'],'N/A')},
TypeError: list indices must be integers or slices, not str
Run Code Online (Sandbox Code Playgroud)
我究竟做错了什么?
而不是i.get(['B1']['bc'],'N/A')使用 来获取嵌套键,这不是有效的 python 语法i.get('B1', {}).get('bc', 'N/A')。也不要动态附加到 pandas 数据帧,它很慢。首先追加到列表,然后将列表转换为数据帧。
lst = []
for i in l1:
lst.append({
'bc': i.get('B1', {}).get('bc', 'N/A'),
'bd': i.get('B1', {}).get('bd', 'N/A'),
'cb': i.get('C1', {}).get('cb', 'N/A'),
'D1': i.get('D1', 'N/A')
})
pd.DataFrame(lst)
bc bd cb D1
0 string string [[[123, 123], [123, 123]]] string
Run Code Online (Sandbox Code Playgroud)