我知道这一定非常简单,但是我很难找到正确的 dplyr 命令来执行此操作。假设我想按两个变量对数据集进行分组,然后总结每行的计数。为此,我们只需:
mtcars %>% group_by(cyl, mpg) %>% summarize(Count = n())
Run Code Online (Sandbox Code Playgroud)
这将产生27行的三个变量一个数据帧cyl,mpg和Count。我接下来要做的是总结mpg三个cyl值中每一个的平均值。请记住,每行可能包含一个Count大于 1 的值,在计算平均值时必须考虑这一点。我的数据框应该有 3 行,每行 2 个变量cyl,并且Avg_mpg. 有人可以给我一个可以做到这一点的短代码夹头吗?先感谢您。