che*_*men 2 replication r dataframe
我希望能够帮助您完成以下数据整理任务。我有一个如下所示的数据框:
df <- data.frame(var1=c('a', 'b', 'c'), var2=c('d', 'e', 'f'), var3=c('h', 'j', 'k'))
Run Code Online (Sandbox Code Playgroud)
我想用 var1 和 var2 固定次数复制每行数据,比如说 3 次,但不是 var3。我想要用 0 代替 var3 中的缺失值。
最后,我想要这样的:
df.expanded
var1 var2 var3
1 a d h
2 a d 0
3 a d 0
4 b e j
5 b e 0
6 b e 0
7 c f k
8 c f 0
9 c f 0
Run Code Online (Sandbox Code Playgroud)
这确实与链接的问题非常接近,主要区别在于“var3”中的预期值。记住这一点,我将采用以下方法:
## Expand
df.expanded <- df[rep(rownames(df), each = 3), ]
## Replace
df.expanded[["var3"]] <- as.character(df.expanded[["var3"]])
df.expanded[["var3"]][c(FALSE, TRUE, TRUE)] <- 0
## View
df.expanded
# var1 var2 var3
# 1 a d h
# 1.1 a d 0
# 1.2 a d 0
# 2 b e j
# 2.1 b e 0
# 2.2 b e 0
# 3 c f k
# 3.1 c f 0
# 3.2 c f 0
Run Code Online (Sandbox Code Playgroud)
这是使用“data.table”的可能方法:
library(data.table)
df.expanded <- as.data.table(df)[rep(sequence(nrow(df)), each = 3)][
, var3 := replace(as.character(var3), .I %% 3 != 1, 0)][]
df.expanded
# var1 var2 var3
# 1: a d h
# 2: a d 0
# 3: a d 0
# 4: b e j
# 5: b e 0
# 6: b e 0
# 7: c f k
# 8: c f 0
# 9: c f 0
Run Code Online (Sandbox Code Playgroud)