按照熊猫的Where条件进行分组

Kei*_*thx 3 python where-clause pandas pandas-groupby

有这样的数据帧:在此输入图像描述

我创建了列'dif_pause',基于减去'pause_end'和'pause_start'列值并使用groupby()函数进行均值聚合,如下所示:

pauses['dif_pause'] = pauses['pause_end'] - pauses['pause_start']
pauses['dif_pause'].astype(dt.timedelta).map(lambda x: np.nan if pd.isnull(x) else x.days)

pauses_df=pauses.groupby(["subscription_id"])["dif_pause"].mean().reset_index(name="avg_pause")
Run Code Online (Sandbox Code Playgroud)

我想在groupby部分中包含检查pause_end> pause_start(SQL中是否有一些WHERE子句等).怎么能这样做?

谢谢.

jez*_*ael 8

您似乎需要queryboolean indexing首先进行过滤:

pauses.query("pause_end > pause_start")
       .groupby(["subscription_id"])["dif_pause"].mean().reset_index(name="avg_pause")
Run Code Online (Sandbox Code Playgroud)
pauses[pauses["pause_end"] > pauses["pause_start"]]
      .groupby(["subscription_id"])["dif_pause"].mean().reset_index(name="avg_pause")
Run Code Online (Sandbox Code Playgroud)