我正在处理一个大型数据集(在python中有pandas),我有一个类似于以下结构的数据帧:
class value
0 1 6
1 1 4
2 1 5
3 5 6
4 5 2
...
n 225 3
Run Code Online (Sandbox Code Playgroud)
然而,这些类不断地在数据帧中增长; 缺少一些值,如示例中所示.我想知道如何从每个类获得简单的统计数据,如min或max,并将其分配给新功能.
class value min
0 1 6 4
1 1 4 4
2 1 5 4
3 5 6 2
4 5 2 2
...
n 225 3 3
Run Code Online (Sandbox Code Playgroud)
我能想出的唯一解决方案是耗时的循环.
通过使用 transform
df['min']=df.groupby('class')['value'].transform('min')
df
Out[497]:
class value min
0 1 6 4
1 1 4 4
2 1 5 4
3 5 6 2
4 5 2 2
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
66 次 |
| 最近记录: |