如何在 python pandas 中进行分组并将一列的计数除以数据帧第二列的唯一计数?

May*_*tel 4 python mysql numpy pandas

我有 4 列的熊猫数据框,分别是“col1”、“col2”、“col3”和“col4”,现在我想按 col1 和 col2 进行分组,并希望采用下面的聚合。

Count(col3)/(Count(unique col4)) As result_col
Run Code Online (Sandbox Code Playgroud)

我该怎么做呢?我正在将 MySql 与 pandas 一起使用。

我从互联网上尝试了很多方法,但没有得到确切的解决方案,这就是我在这里发帖的原因。给出否决的理由,以便我可以改进我的问题。

jez*_*ael 5

看来您需要aggregatebysizenuniquethendiv输出列:

df = pd.DataFrame({'col1':[1,1,1],
                   'col2':[4,4,6],
                   'col3':[7,7,9],
                   'col4':[3,3,5]})

print (df)
   col1  col2  col3  col4
0     1     4     7     3
1     1     4     7     3
2     1     6     9     5

df1 = df.groupby(['col1','col2']).agg({'col3':'size','col4':'nunique'})
df1['result_col'] = df1['col3'].div(df1['col4'])
print (df1)
           col4  col3  result_col
col1 col2                        
1    4        1     2         2.0
     6        1     1         1.0
Run Code Online (Sandbox Code Playgroud)