che*_*ens 3 python dataframe python-3.x pandas pandasql
我有以下datadrame
user_id var qualified_date loyal_date
1 1 2017-01-17 2017-02-03
2 1 2017-01-03 2017-01-13
3 1 2017-01-11 NaT
4 1 NaT NaT
5 1 NaT NaT
6 2 2017-01-15 2017-02-14
7 2 2017-01-07 NaT
8 2 2017-01-23 2017-02-18
9 2 2017-01-25 NaT
10 2 2017-01-11 2017-03-01
Run Code Online (Sandbox Code Playgroud)
我需要通过'Var'中的值对此数据帧进行分组,然后计算每个'qualified_date'和'engaged_date'列的非缺失值的数量.我可以单独为每个列执行此操作并将它们手动放入数据框中,但我正在寻找一个groupby方法或类似的方法,我可以自动进入一个新的DF而不是'var'中的值作为索引和两列显示每个组的非缺失值的计数.
像这样
var qualified_count loyal_count
1 xx xx
2 xx xx
Run Code Online (Sandbox Code Playgroud)
您可以在计数时使用DF.GroupBy.count仅包含非NaN条目的内容.因此,您可以var将分组键分别聚合,然后分别对所选的两个列进行聚合,DF如下所示:
cols = ['qualified_date', 'loyal_date']
df.groupby('var')[cols].agg('count').add_suffix("_count").reset_index()
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2617 次 |
| 最近记录: |