May*_*tel 4 python mysql numpy pandas
我有 4 列的熊猫数据框,分别是“col1”、“col2”、“col3”和“col4”,现在我想按 col1 和 col2 进行分组,并希望采用下面的聚合。
Count(col3)/(Count(unique col4)) As result_col
Run Code Online (Sandbox Code Playgroud)
我该怎么做呢?我正在将 MySql 与 pandas 一起使用。
我从互联网上尝试了很多方法,但没有得到确切的解决方案,这就是我在这里发帖的原因。给出否决的理由,以便我可以改进我的问题。
看来您需要aggregatebysize和nuniquethendiv输出列:
df = pd.DataFrame({'col1':[1,1,1],
'col2':[4,4,6],
'col3':[7,7,9],
'col4':[3,3,5]})
print (df)
col1 col2 col3 col4
0 1 4 7 3
1 1 4 7 3
2 1 6 9 5
df1 = df.groupby(['col1','col2']).agg({'col3':'size','col4':'nunique'})
df1['result_col'] = df1['col3'].div(df1['col4'])
print (df1)
col4 col3 result_col
col1 col2
1 4 1 2 2.0
6 1 1 1.0
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2099 次 |
| 最近记录: |