找出R表中的列是否包含重复值?

Ama*_*nda 9 r duplicates

我有一个可爱的数据帧,我的第一个,我开始得到R的一个东西.我无法找到的一件事是重复值的测试.我有一个专栏,我很确定它是所有独特的价值观,但我不知道.

有什么办法可以问吗?为简单起见,让我们假装这是我的数据:

  var1 var2 var3
1    1    A    1
2    2    B    3
3    3    C   NA
4    4    D   NA
5    5    E    4
Run Code Online (Sandbox Code Playgroud)

我想知道是否var1重复.

Eri*_*lts 15

看看duplicated功能:

duplicated(dat$var1) # the rows of dat var1 duplicated
Run Code Online (Sandbox Code Playgroud)

文档在这里.

你还应该看看这个unique功能.

  • 文档还提到了"anyDuplicated",它可能更直接相关. (4认同)
  • @Joran应该指出的是,`any(duplicated(dat$var1))`将给出一个T/F值,而`anyDuplicated(dat$var1)`将给出一个index/0值。 (4认同)
  • 请注意,`anyDuplicated`返回第一个副本的索引,而不是重复的计数.使用它而不是任何(重复(...))的全部意义在于,返回正数会更快,因为它会在第一个时停止. (2认同)