根据2列删除重复值

lmc*_*ane 5 r duplicates

我想删除基于在一个数据帧2列匹配重复值,v2v4被删除行之间必须匹配.

> df

   v1  v2  v3   v4  v5
1  7   1   A  100  98 
2  7   2   A  100  97
3  8   1   C   NA  80
4  8   1   C   78  75
5  8   1   C   78  62
6  9   3   C   75  75
Run Code Online (Sandbox Code Playgroud)

为了结果

> df

   v1  v2  v3   v4  v5
1  7   1   A  100  98 
2  8   1   C   NA  80
3  8   1   C   78  75
4  9   3   C   75  75
Run Code Online (Sandbox Code Playgroud)

我知道我想要的东西:

df[!duplicated(df[v2] && df[v4]),] 
Run Code Online (Sandbox Code Playgroud)

但这不起作用.

小智 23

这将为您提供所需的结果:

df [!duplicated(df[c(1,4)]),]
Run Code Online (Sandbox Code Playgroud)

  • 您好,如果您想使用其列名称(例如 v1 和 v4)而不是列号 1、4 该怎么办? (3认同)
  • @Bustergun你可以使用 df[!duplicated(df[c("V1","V4")]),] (3认同)