如何使用列表从嵌套字典构建MultiIndex Pandas DataFrame

Question

如何使用列表从嵌套字典构建MultiIndex Pandas DataFrame

New*_*ler 2 python dictionary multi-index dataframe pandas

我有以下字典.

d= {'key1': {'sub-key1': ['a','b','c','d','e']},
    'key2': {'sub-key2': ['1','2','3','5','8','9','10']}}

Run Code Online (Sandbox Code Playgroud)

在这篇文章的帮助下,我成功地将这个字典转换为DataFrame.

df = pd.DataFrame.from_dict({(i,j): d[i][j] 
                            for i in d.keys() 
                            for j in d[i].keys()},
                            orient='index')

Run Code Online (Sandbox Code Playgroud)

但是,我的DataFrame采用以下形式:

                  0  1  2  3  4     5     6
(key1, sub-key1)  a  b  c  d  e  None  None
(key2, sub-key2)  1  2  3  5  8     9    10

Run Code Online (Sandbox Code Playgroud)

我可以使用元组作为索引值,但我认为使用多级DataFrame更好.像这样的帖子帮助我分两步创建它,但是我很难一步完成(即从最初的创建),因为字典中的列表以及之后的元组添加了一个级别并发症.

Answer 1

jez*_*ael 8

我认为你很接近,因为MultiIndex可能使用的MultiIndex.from_tuples方法:

d = {(i,j): d[i][j] 
       for i in d.keys() 
       for j in d[i].keys()}

mux = pd.MultiIndex.from_tuples(d.keys())
df = pd.DataFrame(list(d.values()), index=mux)
print (df)
               0  1  2  3  4     5     6
key1 sub-key1  a  b  c  d  e  None  None
key2 sub-key2  1  2  3  5  8     9    10

Run Code Online (Sandbox Code Playgroud)

谢谢,Zero为另一个解决方案:

df = pd.DataFrame.from_dict({(i,j): d[i][j] 
                            for i in d.keys() 
                            for j in d[i].keys()},
                            orient='index')

df.index = pd.MultiIndex.from_tuples(df.index)
print (df)
               0  1  2  3  4     5     6
key1 sub-key1  a  b  c  d  e  None  None
key2 sub-key2  1  2  3  5  8     9    10

Run Code Online (Sandbox Code Playgroud)

归档时间：	8 年，1 月前
查看次数：	2099 次
最近记录：	8 年，1 月前