pandas:在groupby组内对观察进行排序

Question

pandas:在groupby组内对观察进行排序

根据pandas group的答案,在组内进行排序,为了对每组中的观察进行排序,需要对第一组groupby的结果做一秒钟groupby.为什么需要一秒groupby？我会一直认为观察运行后的第一个已配置为组groupby和所有将需要是列举这些群体(和运行方式apply与order).

Answer 1

tva*_*tar 11

因为一旦你在一个groupby之后应用一个函数,结果会被组合回一个普通的未组合数据框.使用groupby和groupby方法(如sort)应该被认为是Split-Apply-Combine操作

groupby分割原始数据帧,并将该方法应用于每个组,但随后隐式地再次组合结果.

在另一个问题中,他们可以颠倒操作(先排序)然后不必使用两个groupbys.他们可以这样做:

df.sort(['job','count'],ascending=False).groupby('job').head(3)

Run Code Online (Sandbox Code Playgroud)

注意：不赞成使用sort_values (4认同)

归档时间：	9 年，11 月前
查看次数：	12942 次
最近记录：	6 年，9 月前