我有一个具有以下格式的表格:
data = {'City' : ['London', 'Paris', 'Paris','NY' 'London'], 'Distance' : [5, 1, 7, 2, 6]}
df = pd.DataFrame(data)
df
City Distance
0 London 5
1 Paris 1
2 Paris 7
3 NY 2
4 London 6
Run Code Online (Sandbox Code Playgroud)
我想创建一个所有行都具有唯一“城市”的表,并且每当有 2 行或更多行具有相同的“城市”值时,我希望它返回具有最低“距离”的行。所以在这种情况下,我想要一个这样的表:
City Distance
London 5
Paris 1
NY 2
Run Code Online (Sandbox Code Playgroud)
我知道我可以使用:
df.groupby('City')
Run Code Online (Sandbox Code Playgroud)
但我不知道要添加什么才能返回最小的“距离”。
最好的,罗莎