根据pandas group的答案,在组内进行排序,为了对每组中的观察进行排序,需要对第一组groupby的结果做一秒钟groupby.为什么需要一秒groupby?我会一直认为观察运行后的第一个已配置为组groupby和所有将需要是列举这些群体(和运行方式apply与order).
tva*_*tar 11
因为一旦你在一个groupby之后应用一个函数,结果会被组合回一个普通的未组合数据框.使用groupby和groupby方法(如sort)应该被认为是Split-Apply-Combine操作
groupby分割原始数据帧,并将该方法应用于每个组,但随后隐式地再次组合结果.
在另一个问题中,他们可以颠倒操作(先排序)然后不必使用两个groupbys.他们可以这样做:
df.sort(['job','count'],ascending=False).groupby('job').head(3)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
12942 次 |
| 最近记录: |