Jim*_*erg 6 python python-3.x pandas
我正在尝试在给定此 groupby 索引的表上执行 groupby,所有值都是正确的或 Nan。例如:
id country name
0 1 France None
1 1 France Pierre
2 2 None Marge
3 1 None Pierre
4 3 USA Jim
5 3 None Jim
6 2 UK None
7 4 Spain Alvaro
8 2 None Marge
9 3 None Jim
10 4 Spain None
11 3 None Jim
Run Code Online (Sandbox Code Playgroud)
我只想获取 4 个人中每个人的值,这些值不应该发生冲突,例如:
country name
id
1 France Pierre
2 UK Marge
3 USA Jim
4 Spain Alvaro
Run Code Online (Sandbox Code Playgroud)
我试过了:
groupby().first()
groupby.nth(0,dropna='any'/'all')
Run Code Online (Sandbox Code Playgroud)
乃至
groupby().apply(lambda x: x.loc[x.first_valid_index()])
Run Code Online (Sandbox Code Playgroud)
一切都无济于事。我错过了什么?
编辑:帮助您制作用于测试的示例数据框:
df = pd.DataFrame({'id':[1,1,2,1,3,3,2,4,2,3,4,3],'country':['France','France',None,None,'USA',None,'UK','Spain',None,None,'Spain',None],'name':[None,'Pierre','Marge','Pierre','Jim','Jim',None,'Alvaro','Marge','Jim',None,'Jim']})
Run Code Online (Sandbox Code Playgroud)
Pandas groupby.first返回第一个非空值但不支持 None,试试
df.fillna(np.nan).groupby('id').first()
country name
id
1 France Pierre
2 UK Marge
3 USA Jim
4 Spain Alvaro
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1515 次 |
| 最近记录: |