将总行添加到 pandas DataFrame groupby

Question

将总行添加到 pandas DataFrame groupby

use*_*864 12 python group-by pivot-table python-3.x pandas

我知道这个链接，但我没能解决我的问题。

我有以下数据帧pandas.DataFrame.groupby().sum()：

                                                          Value
Level      Company         Item
    1            X            a                             100
                              b                             200
                 Y            a                              35
                              b                             150
                              c                              35
    2            X            a                              48
                              b                             100
                              c                              50
                 Y            a                              80

Run Code Online (Sandbox Code Playgroud)

并想为我必须获得的每个索引级别添加总行数：

                                                          Value
Level      Company         Item
    1            X            a                             100
                              b                             200
                          Total                             300
                 Y            a                              35
                              b                             150
                              c                              35
                          Total                             520
             Total                                          820
    2            X            a                              48
                              b                             100
                              c                              50
             Total                                          198
                 Y            a                              80
                          Total                              80
               Total                                        278
Total                                                      1098

Run Code Online (Sandbox Code Playgroud)

就像要求的一样

level = list(map(int, list('111112222')))
company = list('XXYYYXXXY')
item = list('ababcabca')
value = [100,200,35,150,35,48,100,50,80]
col = ['Level', 'Company', 'Item', 'Value']
df = pd.DataFrame([level,company,item,value]).T
df.columns = col
df.groupby(['Level', 'Company', 'Item']).sum()

Run Code Online (Sandbox Code Playgroud)

Answer 1

ank*_*_91 10

您可以使用：

m=df.groupby(['Level','Company','Item'])['Value'].sum().unstack()
m.assign(total=m.sum(1)).stack().to_frame('Value')

Run Code Online (Sandbox Code Playgroud)

                     Value
Level Company Item        
1     X       a      100.0
              b      200.0
              total  300.0
      Y       a       35.0
              b      150.0
              c       35.0
              total  220.0
2     X       a       48.0
              b      100.0
              c       50.0
              total  198.0
      Y       a       80.0
              total   80.0

Run Code Online (Sandbox Code Playgroud)

Answer 2

Yen*_*Yen 2

您可以尝试一次堆叠一层：

m = df.groupby(['Level','Company','Item'])['Value'].sum().unstack(level=['Company','Item'])
m = m.assign(total=m.sum(1))
m = m.stack(level='Company')
m = m.assign(total=m.sum(1))
m = m.stack(level='Item')

Run Code Online (Sandbox Code Playgroud)

但输出有重复的总数：

Level  Company  Item 
1      X        a        100.0
                b        200.0
                total    300.0
       Y        a         35.0
                b        150.0
                c         35.0
                total    220.0
       total             520.0
                total    520.0
2      X        a         48.0
                b        100.0
                c         50.0
                total    198.0
       Y        a         80.0
                total     80.0
       total             278.0
                total    278.0
dtype: float64

Run Code Online (Sandbox Code Playgroud)

归档时间：	6 年，1 月前
查看次数：	21448 次
最近记录：	6 年，1 月前