pandas groupby - 返回满足条件的组中的第一行

Question

pandas groupby - 返回满足条件的组中的第一行

mee*_*ram 2 python pandas pandas-groupby

鉴于下面的示例数据集，我想返回一行，group显示obsnum第一行的小于score0.4。

import pandas as pd
import numpy as np

np.random.seed(42)

df = pd.DataFrame({'group': ['a', 'a', 'a', 'a', 'b', 'b', 'b', 'b', 'c', 'c', 'c', 'c'],
'obsnum': [1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4],
'score' : np.random.rand(12)})

Run Code Online (Sandbox Code Playgroud)

数据框如下所示：

df
  group obsnum  score
0   a     1   0.374540
1   a     2   0.950714
2   a     3   0.731994
3   a     4   0.598658
4   b     1   0.156019
5   b     2   0.155995
6   b     3   0.058084
7   b     4   0.866176
8   c     1   0.601115
9   c     2   0.708073
10  c     3   0.020584
11  c     4   0.969910

Run Code Online (Sandbox Code Playgroud)

返回的结果应该像这样并存储在另一个数据框中。

group   obsnum  score
a         1     0.374540
b         1     0.156019
c         3     0.020584

Run Code Online (Sandbox Code Playgroud)

我已经尝试过这个df.groupby('group').apply(lambda x: x['score'] <= 0.4)和这个df.groupby('group')['obsnum', 'score'].min()，但都不是我所追求的。

Answer 1

Flo*_*oor 6

您可以使用

df[df['score'].le(0.4)].groupby('group').first()

     obsnum     score
group                  
a           1  0.374540
b           1  0.156019
c           3  0.020584

Run Code Online (Sandbox Code Playgroud)

`df[df['score'].le(0.4)].groupby('group', as_index=False).first()` ？ (2认同)

归档时间：	8 年，2 月前
查看次数：	1415 次
最近记录：	8 年，2 月前