为 python/pandas 中的每一行分配组平均值

Question

为 python/pandas 中的每一行分配组平均值

aid*_*att 5 python group-by mean pandas pandas-groupby

我有一个数据框，我希望根据商店和所有商店计算平均值。我创建了代码来计算平均值，但我正在寻找一种更有效的方法。

DF

Cashier#     Store#     Sales    Refunds
001          001        100      1
002          001        150      2
003          001        200      2
004          002        400      1
005          002        600      4

Run Code Online (Sandbox Code Playgroud)

DF-期望

Cashier#     Store#     Sales    Refunds     Sales_StoreAvg    Sales_All_Stores_Avg
001          001        100      1            150               290
002          001        150      2            150               290
003          001        200      2            150               290
004          002        400      1            500               290
005          002        600      4            500               290

Run Code Online (Sandbox Code Playgroud)

我的尝试我创建了两个额外的数据框，然后进行了左连接

df.groupby(['Store#']).sum().reset_index().groupby('Sales').mean()

Run Code Online (Sandbox Code Playgroud)

Answer 1

jez*_*ael 5

我认为需要GroupBy.transform由聚合值填充的新列mean：

df['Sales_StoreAvg'] = df.groupby('Store#')['Sales'].transform('mean')
df['Sales_All_Stores_Avg'] = df['Sales'].mean()
print (df)
   Cashier#  Store#  Sales  Refunds  Sales_StoreAvg  Sales_All_Stores_Avg
0         1       1    100        1             150                 290.0
1         2       1    150        2             150                 290.0
2         3       1    200        2             150                 290.0
3         4       2    400        1             500                 290.0
4         5       2    600        4             500                 290.0

Run Code Online (Sandbox Code Playgroud)

归档时间：	8 年，2 月前
查看次数：	1812 次
最近记录：	8 年，2 月前