我有一个如下所示的数据框:
Name Start_Date End_Date
A 2015-01-01 2019-12-29
A 2017-03-25 NA
A 2019-10-17 NA
A 2012-04-16 2015-01-09
A 2002-06-01 2006-02-01
A 2005-12-24 NA
B 2018-01-23 NA
Run Code Online (Sandbox Code Playgroud)
我想创建一个列,如果两个观察结果相同Name,并且一个Start_Date观察结果与另一个观察结果相差 ±1 年End_Date,则它们被归类为同一组。
期望的输出:
Name Start_Date End_Date Wanted
A 2015-01-01 2019-12-29 1
A 2017-03-25 NA NA
A 2019-10-17 NA 1
A 2012-04-16 2015-01-09 1
A 2002-06-01 2006-02-01 2
A 2005-12-24 NA 2
B 2018-01-23 NA NA
Run Code Online (Sandbox Code Playgroud)
我正在寻找带有数据表的解决方案,但解决我的问题就足够了。
补充: 逐行解释
行: