sta*_*uyz 0 r dataframe dplyr locf
我想用 R 中的最后观察结转 (LOCF) 方法替换所有 NA 值。我拥有的数据集如下:
Value1 Value2 Value3 Group
100 56 82 Group1
150 NA 97 Group2
NA 66 NA Group3
120 NA NA Group4
Run Code Online (Sandbox Code Playgroud)
我想创建以下数据集:
Value1 Value2 Value3 Group
100 56 82 Group1
150 56 97 Group2
150 66 97 Group3
120 66 97 Group4
Run Code Online (Sandbox Code Playgroud)
任何有关如何做到这一点的见解将不胜感激。
foo = function(x) {
x[cummax((!is.na(x)) * seq_along(x))]
}
data.frame(lapply(df, foo))
Run Code Online (Sandbox Code Playgroud)
如果第一个元素也可以NA,则使用以下函数
foo = function(x) {
x[cummax(pmax(1, (!is.na(x)) * seq_along(x)))]
}
Run Code Online (Sandbox Code Playgroud)
你可以使用fill来自tidyr.
tidyr::fill(df, everything())
# Value1 Value2 Value3 Group
#1 100 56 82 Group1
#2 150 56 97 Group2
#3 150 66 97 Group3
#4 120 66 97 Group4
Run Code Online (Sandbox Code Playgroud)
或者与zoo::na.locf
df[] <- lapply(df, zoo::na.locf)
Run Code Online (Sandbox Code Playgroud)
数据
df <- structure(list(Value1 = c(100L, 150L, NA, 120L), Value2 = c(56L,
NA, 66L, NA), Value3 = c(82L, 97L, NA, NA), Group = structure(1:4,
.Label = c("Group1", "Group2", "Group3", "Group4"), class = "factor")),
class = "data.frame", row.names = c(NA, -4L))
Run Code Online (Sandbox Code Playgroud)