在 Pandas 中使用 groupby 时恢复分层列索引

Question

在 Pandas 中使用 groupby 时恢复分层列索引

我groupby在 Pandas 中使用Pandas 来计算数据的一些聚合统计数据，其中数据框中的列是用分层索引组织的。对于计算的统计信息，我想最终回到表格形式，其中将组重新转换为具有组值的列，例如：

index = pd.MultiIndex.from_tuples([('A', 'a'), ('B', 'b')])
df = pd.DataFrame(np.random.randn(8,2), columns=index)

Run Code Online (Sandbox Code Playgroud)

这导致例如这个数据框

          A         B
          a         b
0  0.511157  0.334748
1  0.031113 -0.477456
2  0.288080 -0.258238
3  0.138467 -0.955547
4 -0.087873  0.017494
5 -0.667393  1.190039
6 -0.068245 -1.282864
7 -0.996982  0.589667

Run Code Online (Sandbox Code Playgroud)

现在我使用 groupby 计算统计数据并重置索引以重新创建平面数据框：

df.groupby([('A','a')]).mean().reset_index()
     (A, a)         B
                    b
0 -0.996982  0.589667
1 -0.667393  1.190039
2 -0.087873  0.017494
3 -0.068245 -1.282864
4  0.031113 -0.477456
5  0.138467 -0.955547
6  0.288080 -0.258238
7  0.511157  0.334748

Run Code Online (Sandbox Code Playgroud)

我怎样才能实现它('A', 'a')再次成为多索引的一部分，希望以自动方式？或者另有说明：有没有办法在 groupby 操作期间保留分层列结构。

Answer 1

jez*_*ael 5

对我来说，将参数添加as_index=False到groupby：

print df.groupby([('A','a')], as_index=False).mean()
          A         B
          a         b
0 -0.765088 -0.556601
1 -0.628040  2.074559
2 -0.516396 -2.028387
3 -0.152027  0.389853
4  0.450218  1.474989
5  0.718040 -0.882018
6  1.932556 -0.977316
7  2.028468 -0.875167

Run Code Online (Sandbox Code Playgroud)

归档时间：	9 年，9 月前
查看次数：	957 次
最近记录：	9 年，9 月前