pandas 在pivot_table期间聚合多个列

Question

pandas 在pivot_table期间聚合多个列

有一个像这样的数据框：

df = pd.DataFrame((['1990-01-01','A','S1','2','string2','string3'],
 ['1990-01-01','A','S2','1','string1','string4'],
 ['1990-01-01','A','S3','1','string5','string6']),columns= 
 ["date","type","status","count","s1","s2")


           date type status count       s1       s2
 0  1990-01-01    A     S1     2  string2  string3
 1  1990-01-01    A     S2     1  string1  string4
 2  1990-01-01    A     S3     1  string5  string6
 ...

Run Code Online (Sandbox Code Playgroud)

我想要得到以下结果（每个日期和每种类型应该有单行，并获取 s1 列的最小值，获取 s2 列的最大值）

date             type       S1    S2   S3    min_s1        max_s2
1990-01-01       A           2     1   1     string1      string6

Run Code Online (Sandbox Code Playgroud)

我尝试使用pivot_table

df.pivot_table(index=['date','type'],columns=['status'],values=['count','s1','s2'], aggfunc={
'count':np.sum, 
's1': np.min,
's2': np.max
})

Run Code Online (Sandbox Code Playgroud)

但这只会得到以下结果，这会导致多列而不是最终结果。

                count             s1                         s2
status             S1 S2 S3       S1       S2       S3       S1       S2       S3
date       type
1990-01-01 A        2  1  1  string2  string1  string5  string3  string4  string6

Run Code Online (Sandbox Code Playgroud)

有人有想法吗？谢谢。

Answer 1

moz*_*way 5

看起来您想组合 apivot和groupby.agg：

(df.pivot(index=['date','type'],columns='status', values='count')
   .join(df.groupby(['date', 'type']).agg({'s1': 'min', 's2': 'max'}))
   .reset_index()
)

Run Code Online (Sandbox Code Playgroud)

输出：

         date type S1 S2 S3       s1       s2
0  1990-01-01    A  2  1  1  string1  string6

Run Code Online (Sandbox Code Playgroud)

归档时间：	3 年，5 月前
查看次数：	103 次
最近记录：	3 年，5 月前