我对R来说还是比较新的,如果我的问题看起来太基础,请提前道歉.
我的问题如下:
我有一个包含几个因子变量的数据集,它们具有相同的类别.我需要找到这个类别,这个类别最常出现在因子变量的每个观察中.在关系的情况下,可以选择任意值,尽管如果我可以对其进行更多控制则会很好.
我的数据集包含一百多个因素.但是,结构是这样的:
id <- 1:3
var1 <- c("red","yellow","green")
var2 <- c("red","yellow","green")
var3 <- c("yellow","orange","green")
var4 <- c("orange","green","yellow")
df <- data.frame(cbind(id, var1, var2, var3, var4))
> df
id var1 var2 var3 var4
1 1 red red yellow orange
2 2 yellow yellow orange green
3 3 green green green yellow
Run Code Online (Sandbox Code Playgroud)
解决方案应该是数据框中的变量,例如var5,它包含每行的最常见类别.它可以是因子或数字向量(如果数据需要首先转换为数字向量)
在这种情况下,我想有这个解决方案:
> df$var5
[1] "red" "yellow" "green"
Run Code Online (Sandbox Code Playgroud)
任何建议将不胜感激!提前致谢!