Jam*_*s_S 5 r time-series dataframe
我希望有人可以帮我解决这个问题.我正在处理每五年有一次记录的时间序列数据.数据框df是一个示例,其中包含时间步长df$Time并记录值 df$A.
df
Time A
5 4.8
10 19.6
15 27.5
20 39.7
Run Code Online (Sandbox Code Playgroud)
我需要做的是转换df为年度时间序列,并根据计算使用新值填充所有新记录.我使用以下方法成功转换df为年度数据df2:
df2 <- data.frame("Time" = c(5:20), "A" = c(5:20))
df2$A[] <- sapply(df2$A, function(x) df$A[match(x, df$Time)])
df2[is.na(df2)] <- 0
df2
Time A
5 4.8
6 0
7 0
8 0
9 0
10 19.6
11 0
12 0
13 0
14 0
15 27.5
16 0
17 0
18 0
19 0
20 39.7
Run Code Online (Sandbox Code Playgroud)
我无法弄清楚的是如何计算新值df2$A.计算取决于其他行/记录值的相对位置 - 例如,df2$A[2]计算将是df2$A[2] <- df2$A[1] + (df2$A[6] - df2$A[1])/5.例如,它也会在整个数据框中发生变化df2$A[7] <- df2$A[6] + (df2$A[11] – df2$A[6]) / 5.
for循环只产生了挫败感,我试图在不为每条新记录执行一行代码的情况下这样做(实际数据有数百条记录).我正努力以df3有效的方式 - 谢谢!
df3
Time A
5 4.8
6 7.76
7 10.72
8 13.68
9 16.64
10 19.6
11 21.18
12 22.76
13 24.34
14 25.92
15 27.5
16 29.94
17 32.38
18 34.82
19 37.26
20 39.7
Run Code Online (Sandbox Code Playgroud)
您正在寻找的称为线性插值。approx在 R 中,您可以像这样使用该函数:
df <- data.frame("Time" = c(5, 10, 15, 20), "A" = c(4.8, 19.6, 27.5, 39.7))
df2 <- as.data.frame(approx(x = df$Time, y = df$A, xout = 5:20))
names(df2) <- names(df)
Run Code Online (Sandbox Code Playgroud)
结果:
> df2
Time A
1 5 4.80
2 6 7.76
3 7 10.72
4 8 13.68
5 9 16.64
6 10 19.60
7 11 21.18
8 12 22.76
9 13 24.34
10 14 25.92
11 15 27.50
12 16 29.94
13 17 32.38
14 18 34.82
15 19 37.26
16 20 39.70
Run Code Online (Sandbox Code Playgroud)