CHO*_*ONG 0 validation r duplicates
我需要进行数据验证,以确定CodeA1,CodeA2和Code A3(列)中是否有任何重复项.
CodeA1 CodeA2 CodeA3
1 1 NA 5
2 3 1 3
3 8 3 3
4 3 NA NA
5 4 1 2
6 1 8 3
Run Code Online (Sandbox Code Playgroud)
所有列中的行(CodeA1,CodeA2,CodeA3)应该是唯一的.
有人可以帮R吗?
我想确定所有行的重复项,并得到如下结果
CodeA1 CodeA2 CodeA3 Duplicate
1 1 NA 5 No
2 3 1 3 Yes
3 8 3 3 Yes
4 3 NA NA No
5 4 1 2 No
6 1 8 3 No
Run Code Online (Sandbox Code Playgroud)
可能的解决方案是:
dtset$Duplicate <- apply(dtset,1,function(x) any(table(x)>1))
dtset
########
CodeA1 CodeA2 CodeA3 Duplicate
1 1 NA 5 FALSE
2 3 1 3 TRUE
3 8 3 3 TRUE
4 3 NA NA FALSE
5 4 1 2 FALSE
6 1 8 3 FALSE
Run Code Online (Sandbox Code Playgroud)