我希望我能为我的问题找到帮助.我正在寻找以下问题的解决方案:
我有一个dataFrame,如:
Sp Mt Value count
0 MM1 S1 a **3**
1 MM1 S1 n 2
2 MM1 S3 cb 5
3 MM2 S3 mk **8**
4 MM2 S4 bg **10**
5 MM2 S4 dgd 1
6 MM4 S2 rd 2
7 MM4 S2 cb 2
8 MM4 S2 uyi **7**
Run Code Online (Sandbox Code Playgroud)
我的目标是获取组之间计数最大的结果行,例如:
0 MM1 S1 a **3**
1 3 MM2 S3 mk **8**
4 MM2 S4 bg **10**
8 MM4 S2 uyi **7**
Run Code Online (Sandbox Code Playgroud)
有人知道我怎么能在熊猫或python中做到这一点?
UPDATE
我没有提供更多关于我的问题的细节.对于我的问题,我想按['Sp','Mt'分组.让我们举个第二个例子:
Sp Mt Value count …
Run Code Online (Sandbox Code Playgroud) id marks year
1 18 2013
1 25 2012
3 16 2014
2 16 2013
1 19 2013
3 25 2013
2 18 2014
Run Code Online (Sandbox Code Playgroud)
假设现在我通过python命令将上面的id分组.
grouped = file.groupby(file.id)
我想获得一个新文件,每个组中只有一行,最近一年是该组中一年中最高的一年.
请告诉我这个命令,我正在尝试使用apply但它只给出了布尔表达式.我想要最新一年的整行.