考虑表单的数据框架
idnum start end
1993.1 17 1993-01-01 1993-12-31
1993.2 17 1993-01-01 1993-12-31
1993.3 17 1993-01-01 1993-12-31
Run Code Online (Sandbox Code Playgroud)
有start和end类型Date
$ idnum : int 17 17 17 17 27 27
$ start : Date, format: "1993-01-01" "1993-01-01" "1993-01-01" "1993-01-01" ...
$ end : Date, format: "1993-12-31" "1993-12-31" "1993-12-31" "1993-12-31" ...
Run Code Online (Sandbox Code Playgroud)
我想创建一个新的数据帧,而不是每行的每月观察,中间的每个月start和end(包括边界):
期望的输出
idnum month
17 1993-01-01
17 1993-02-01
17 1993-03-01
...
17 1993-11-01
17 1993-12-01
Run Code Online (Sandbox Code Playgroud)
我不确定month应该采用什么格式,我会在某些时候想要分组idnum,month以便对其余数据集进行回归. …
我想将具有起始年和结束年变量的数据框转换为完整的时间序列,其中(1)包括起始年和结束年之间的所有年份,(2)填写以下值其间年份的所有变量。
原始数据如下所示:
data_original <- data.frame(name = c("peter", "peter", "eric", "denisse"), lastname = c("smith", "smith", "jordan", "williams"), age = c(54, 54, 48, 40), start_year = c(1980,1986, 1990, 2000), end_year = c(1984, 1988, 1993, 2001))
data_original
#> name lastname age start_year end_year
#> 1 peter smith 54 1980 1984
#> 2 peter smith 54 1986 1988
#> 3 eric jordan 48 1990 1993
#> 4 denisse williams 40 2000 2001
Run Code Online (Sandbox Code Playgroud)
这就是我希望数据的样子:
data_final <- data.frame(name = c("peter", "peter", "peter", "peter", "peter", "peter", "peter", …Run Code Online (Sandbox Code Playgroud)