如何分组并计算pandas中组中每列的无缺失值的数量

Question

如何分组并计算pandas中组中每列的无缺失值的数量

che*_*ens 3 python dataframe python-3.x pandas pandasql

我有以下datadrame

user_id  var  qualified_date    loyal_date
  1       1      2017-01-17     2017-02-03
  2       1      2017-01-03     2017-01-13
  3       1      2017-01-11      NaT
  4       1       NaT            NaT
  5       1       NaT            NaT
  6       2      2017-01-15      2017-02-14
  7       2      2017-01-07      NaT
  8       2      2017-01-23      2017-02-18
  9       2      2017-01-25      NaT
  10      2      2017-01-11      2017-03-01

Run Code Online (Sandbox Code Playgroud)

我需要通过'Var'中的值对此数据帧进行分组,然后计算每个'qualified_date'和'engaged_date'列的非缺失值的数量.我可以单独为每个列执行此操作并将它们手动放入数据框中,但我正在寻找一个groupby方法或类似的方法,我可以自动进入一个新的DF而不是'var'中的值作为索引和两列显示每个组的非缺失值的计数.

像这样

var  qualified_count loyal_count
 1       xx            xx
 2       xx            xx

Run Code Online (Sandbox Code Playgroud)

Answer 1

Nic*_*eli 6

您可以在计数时使用DF.GroupBy.count仅包含非NaN条目的内容.因此,您可以var将分组键分别聚合,然后分别对所选的两个列进行聚合,DF如下所示:

cols = ['qualified_date', 'loyal_date']
df.groupby('var')[cols].agg('count').add_suffix("_count").reset_index()

Run Code Online (Sandbox Code Playgroud)

归档时间：	8 年，10 月前
查看次数：	2617 次
最近记录：	7 年，1 月前