我有一个pandas数据帧df:
Name Score
AAAA 4
AAAA 7
AAAA 12
AAAA 13
BBBB 1
BBBB 1
CCCC 1
CCCC 2
CCCC 27
Run Code Online (Sandbox Code Playgroud)
我想要一个新的数据帧,只有当每个"名称"出现至少3次时才会有来自df的值.即所需的输出是
Name Score
AAAA 4
AAAA 7
AAAA 12
AAAA 13
CCCC 1
CCCC 2
CCCC 27
Run Code Online (Sandbox Code Playgroud)
我知道df.groupby ['Name']给出了每个名字的频率.有关如何使用此信息获取所需输出的任何建议.谢谢
使用groupby和filter:
df.groupby("Name").filter(lambda df:df.shape[0] > 2)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
660 次 |
| 最近记录: |