Python:对数据框中的行进行分组并使用pandas groupby选择组中的abs最大值

Wal*_*llE 6 python dataframe pandas

我正在寻找以下问题的解决方案:

我有一个 pandas 数据框(版本 0.12.0),例如:

df = pd.DataFrame({
    'Time' : [0.0, 0.0, 0.1, 0.2],
    'Signal_1' : [0, 1, 0, 3],
    'Signal_2' : [1, -1.5, -3, 0],        
    })
>>> print df

   Signal_1  Signal_2  Time
0         0       1.0   0.0
1         1      -1.5   0.0
2         0      -3.0   0.1
3         3       2.0   0.2
Run Code Online (Sandbox Code Playgroud)

现在,我使用 groupby 合并具有相同时间戳的行(在本例中为第一行和第二行)。但合并的行应该获得该组的绝对最大值。因此,我正在寻找一个函数 absmax() 来获取以下分组数据帧:

>>> df = df.groupby('Time').absmax()
   Signal_1  Signal_2  Time
0         1      -1.5   0.0
1         0      -3.0   0.1
2         3       2.0   0.2
Run Code Online (Sandbox Code Playgroud)

编辑:谢谢;-)

jez*_*ael 4

你真的很接近 - 需要idxmax索引:

df = df.loc[df.groupby('Signal_1')['Time'].idxmax()]
print (df)
   Signal_1  Signal_2  Time
2         0      -3.0   0.1
1         1      -1.5   0.0
3         3       2.0   0.2
Run Code Online (Sandbox Code Playgroud)

或者也许需要:

df = df.loc[df.groupby('Time')['Time'].apply(lambda x: x.abs().idxmax())]
print (df)
   Signal_1  Signal_2  Time
0         0       1.0   0.0
2         0      -3.0   0.1
3         3       2.0   0.2
Run Code Online (Sandbox Code Playgroud)

或者:

df = df.loc[df.groupby('Time')['Time'].idxmax()]
print (df)
   Signal_1  Signal_2  Time
0         0       1.0   0.0
2         0      -3.0   0.1
3         3       2.0   0.2
Run Code Online (Sandbox Code Playgroud)