Python：对数据框中的行进行分组并使用pandas groupby选择组中的abs最大值

Question

Python：对数据框中的行进行分组并使用pandas groupby选择组中的abs最大值

我正在寻找以下问题的解决方案：

我有一个 pandas 数据框（版本 0.12.0），例如：

df = pd.DataFrame({
    'Time' : [0.0, 0.0, 0.1, 0.2],
    'Signal_1' : [0, 1, 0, 3],
    'Signal_2' : [1, -1.5, -3, 0],        
    })
>>> print df

   Signal_1  Signal_2  Time
0         0       1.0   0.0
1         1      -1.5   0.0
2         0      -3.0   0.1
3         3       2.0   0.2

Run Code Online (Sandbox Code Playgroud)

现在，我使用 groupby 合并具有相同时间戳的行（在本例中为第一行和第二行）。但合并的行应该获得该组的绝对最大值。因此，我正在寻找一个函数 absmax() 来获取以下分组数据帧：

>>> df = df.groupby('Time').absmax()
   Signal_1  Signal_2  Time
0         1      -1.5   0.0
1         0      -3.0   0.1
2         3       2.0   0.2

Run Code Online (Sandbox Code Playgroud)

编辑：谢谢;-)

Answer 1

jez*_*ael 4

你真的很接近 - 需要idxmax索引：

df = df.loc[df.groupby('Signal_1')['Time'].idxmax()]
print (df)
   Signal_1  Signal_2  Time
2         0      -3.0   0.1
1         1      -1.5   0.0
3         3       2.0   0.2

Run Code Online (Sandbox Code Playgroud)

或者也许需要：

df = df.loc[df.groupby('Time')['Time'].apply(lambda x: x.abs().idxmax())]
print (df)
   Signal_1  Signal_2  Time
0         0       1.0   0.0
2         0      -3.0   0.1
3         3       2.0   0.2

Run Code Online (Sandbox Code Playgroud)

或者：

df = df.loc[df.groupby('Time')['Time'].idxmax()]
print (df)
   Signal_1  Signal_2  Time
0         0       1.0   0.0
2         0      -3.0   0.1
3         3       2.0   0.2

Run Code Online (Sandbox Code Playgroud)

归档时间：	8 年，8 月前
查看次数：	4594 次
最近记录：	8 年，8 月前