相关疑难解决方法(0)

如何在包含因子的多个列中查找最常用的值

我对R来说还是比较新的,如果我的问题看起来太基础,请提前道歉.

我的问题如下:

我有一个包含几个因子变量的数据集,它们具有相同的类别.我需要找到这个类别,这个类别最常出现在因子变量的每个观察中.在关系的情况下,可以选择任意值,尽管如果我可以对其进行更多控制则会很好.

我的数据集包含一百多个因素.但是,结构是这样的:

id <- 1:3
var1 <- c("red","yellow","green")
var2 <- c("red","yellow","green")
var3 <- c("yellow","orange","green")
var4 <- c("orange","green","yellow")
df <- data.frame(cbind(id, var1, var2, var3, var4))


> df
  id   var1   var2   var3   var4
1  1    red    red yellow orange
2  2 yellow yellow orange  green
3  3  green  green  green yellow
Run Code Online (Sandbox Code Playgroud)

解决方案应该是数据框中的变量,例如var5,它包含每行的最常见类别.它可以是因子或数字向量(如果数据需要首先转换为数字向量)

在这种情况下,我想有这个解决方案:

> df$var5
[1] "red"    "yellow" "green" 
Run Code Online (Sandbox Code Playgroud)

任何建议将不胜感激!提前致谢!

r mode factors

10
推荐指数
1
解决办法
1万
查看次数

标签 统计

factors ×1

mode ×1

r ×1