在 data.frame 中将每行选择变量复制 n 次

che*_*men 2 replication r dataframe

我希望能够帮助您完成以下数据整理任务。我有一个如下所示的数据框:

df <- data.frame(var1=c('a', 'b', 'c'), var2=c('d', 'e', 'f'), var3=c('h', 'j', 'k'))
Run Code Online (Sandbox Code Playgroud)

我想用 var1 和 var2 固定次数复制每行数据,比如说 3 次,但不是 var3。我想要用 0 代替 var3 中的缺失值。

最后,我想要这样的:

    df.expanded
  var1 var2 var3
1    a    d   h
2    a    d   0
3    a    d   0
4    b    e   j
5    b    e   0
6    b    e   0
7    c    f   k
8    c    f   0
9    c    f   0
Run Code Online (Sandbox Code Playgroud)

A5C*_*2T1 5

这确实与链接的问题非常接近,主要区别在于“var3”中的预期值。记住这一点,我将采用以下方法:

## Expand
df.expanded <- df[rep(rownames(df), each = 3), ]

## Replace
df.expanded[["var3"]] <- as.character(df.expanded[["var3"]])
df.expanded[["var3"]][c(FALSE, TRUE, TRUE)] <- 0

## View
df.expanded
#     var1 var2 var3
# 1      a    d    h
# 1.1    a    d    0
# 1.2    a    d    0
# 2      b    e    j
# 2.1    b    e    0
# 2.2    b    e    0
# 3      c    f    k
# 3.1    c    f    0
# 3.2    c    f    0
Run Code Online (Sandbox Code Playgroud)

这是使用“data.table”的可能方法:

library(data.table)
df.expanded <- as.data.table(df)[rep(sequence(nrow(df)), each = 3)][
  , var3 := replace(as.character(var3), .I %% 3 != 1, 0)][]

df.expanded
#    var1 var2 var3
# 1:    a    d    h
# 2:    a    d    0
# 3:    a    d    0
# 4:    b    e    j
# 5:    b    e    0
# 6:    b    e    0
# 7:    c    f    k
# 8:    c    f    0
# 9:    c    f    0
Run Code Online (Sandbox Code Playgroud)