相关疑难解决方法(0)

从数据帧中成对重复删除

这似乎是一个简单的问题,但我似乎无法弄明白.如果两列具有相同的值,我想从数据帧(df)中删除重复项,即使这些值的顺序相反.我的意思是,说你有以下数据框:

a <- c(rep("A", 3), rep("B", 3), rep("C",2))
b <- c('A','B','B','C','A','A','B','B')
df <-data.frame(a,b)

  a b
1 A A
2 A B
3 A B
4 B C
5 B A
6 B A
7 C B
8 C B

Run Code Online (Sandbox Code Playgroud)

如果我现在删除重复项,我会得到以下数据框:

df[duplicated(df),]

  a b
3 A B
6 B A
8 C B

Run Code Online (Sandbox Code Playgroud)

但是,我还想删除该数据帧中的第6行,因为"A","B"与"B","A"相同.我该如何自动执行此操作？

理想情况下,我可以指定要比较哪两列,因为数据帧可能具有不同的列,并且可能非常大.

谢谢!

r duplicates dataframe

use*_*121

2016 03-14

9
推荐指数

2
解决办法

6295
查看次数

R, 查找重复行，不分顺序

我整晚都在思考这个问题：这是我的矩阵：

'a' '#' 3
'#' 'a' 3
 0  'I am' 2
'I am' 0 2

Run Code Online (Sandbox Code Playgroud)

.....

我想像前两行一样对待行，因为它只是'a'和'#'的不同顺序。就我而言，我想删除此类行。玩具示例很简单，前两个相同，第三个和第四个相同。但在我的数据集中，我不知道“相同”行在哪里。

我正在用 R 写。谢谢。

duplicate-data r

Jia*_* Du

2014 04-10

2
推荐指数

2
解决办法

3097
查看次数

标签统计

r ×2

dataframe ×1

duplicate-data ×1

duplicates ×1

从数据帧中成对重复删除

R, 查找重复行，不分顺序

标签 统计

标签统计