这是样本数据.如果他们在45天之内有4次或更多次就诊,我只需要保留一位患者.我已经转换了数据集并使用数组来找出一种方法,但我希望有一种更有效的方法.
Pat_ID Date Prov_ID
A 05/12/2012 X1
A 05/12/2012 X2
B 11/12/2012 X1
B 11/20/2012 X1
B 01/12/2013 X1
B 03/22/2013 X1
C 04/25/2013 X1
C 04/25/2013 X2
C 04/27/2013 X1
C 05/12/2013 X1
C 05/22/2013 X2
C 04/25/2012 X3
...
Run Code Online (Sandbox Code Playgroud)
我开始删除少于4个事件的观察.
任何想法,将不胜感激.
结果结果应该是在45天内仅具有4次或更多次访问的PAT_ID的数据集.