数据框中一行中的重复值

Question

数据框中一行中的重复值

df <- data.frame(label = c("a","b","c"),
                 val=c("x","b","c"),
                 val1=c("z","b","d"))

   label val val1
1     a   x    z
2     b   b    b
3     c   c    d

Run Code Online (Sandbox Code Playgroud)

我想找出每一行中的重复值。对于第一行，第二行没有重复项，“ b”对于第三行是重复项，“ c”是重复项。如何在R编程中找到此重复项。

另外，我需要用NA值替换重复的元素。

Answer 1

WeN*_*Ben 6

使用duplicated与apply

apply(df,1,duplicated)
      [,1]  [,2]  [,3]
[1,] FALSE FALSE FALSE
[2,] FALSE  TRUE  TRUE
[3,] FALSE  TRUE FALSE

Run Code Online (Sandbox Code Playgroud)

并替换为 NA

df[t(apply(df,1,duplicated))]=NA
df
  label  val val1
1     a    x    z
2     b <NA> <NA>
3     c <NA>    d

Run Code Online (Sandbox Code Playgroud)

归档时间：	7 年，2 月前
查看次数：	84 次
最近记录：	6 年，7 月前