小编bfo*_*e01的帖子

dplyr创建因子水平的总百分比

如何使用dplyr为每个状态创建一个因子变量级别的比例?例如,我想添加一个变量,指示每个状态中女性占数据框的百分比.

# gen data
state <- rep(c(rep("Idaho", 10), rep("Maine", 10)), 2)
student.id <- sample(1:1000,8,replace=T)
gender <- rep( c("Male","Female"), 100*c(0.25,0.75) )  
gender <- sample(gender, 40)
school.data <- data.frame(student.id, state, gender)
Run Code Online (Sandbox Code Playgroud)

这是我知道错误的尝试,但让我访问这些信息:

 middle %>%
   group_by(state, gender %in%c("Female")) %>%
   summarise(count = n()) %>%
   mutate(test_count = count)
Run Code Online (Sandbox Code Playgroud)

我对计数和变异函数很难,这使得很难进一步发展.它没有像我期望的那样表现.

r dplyr

2
推荐指数
2
解决办法
5114
查看次数

标签 统计

dplyr ×1

r ×1