我想用"行距离"填充缺失值到最近的非NA值.换句话说,如何将此示例数据框中的列x转换为y列?
# x y
#1 0 0
#2 NA 1
#3 0 0
#4 NA 1
#5 NA 2
#6 NA 1
#7 0 0
#8 NA 1
#9 NA 2
#10 NA 3
#11 NA 2
#12 NA 1
#13 0 0
Run Code Online (Sandbox Code Playgroud)
我似乎无法找到dplyr group_by和mutate row_number()语句的正确组合来完成这个技巧.我调查过的各种插补包都是针对更复杂的场景而设计的,其中使用统计和其他变量进行插补.
d<-data.frame(x=c(0,NA,0,rep(NA,3),0,rep(NA,5),0),y=c(0,1,0,1,2,1,0,1,2,3,2,1,0))
Run Code Online (Sandbox Code Playgroud) 我正在寻找一种使用dplyr将NA填充到右侧(而不是向下/向上)的方法。换句话说,我想将d转换为d2,而不必在mutate调用中显式引用任何列。我的真实数据框有几十个字段,其中NA的交错块跨越可变的列数。我很好奇,不管它出现在哪个字段中,是否都存在一种全局方法来全局继承左侧的第一个非NA值。
d<-data.frame(c1=c("a",1:4), c2=c(NA,2,NA,4,5), c3=c(NA,3,4,NA,6))
d2<-data.frame(c1=c("a",1:4), c2=c("a",2,2,4,5), c3=c("a",3,4,4,6))
d
d2
Run Code Online (Sandbox Code Playgroud)