dplyr：组计数的平均值

Question

dplyr：组计数的平均值

我正在尝试使用 dplyr 查找数据帧上变量的平均长度：

x <- data %>% group_by(Date, `% Bucket`) %>% summarise(count = n())

Date          % Bucket count
(date)    (fctr) (int)
1  2015-01-05       <=1  1566
2  2015-01-05    (1-25]   421
3  2015-01-05   (25-50]   461
4  2015-01-05   (50-75]   485
5  2015-01-05  (75-100]   662
6  2015-01-05 (100-150]  1693
7  2015-01-05      >150 12359
8  2015-01-13       <=1  1608
9  2015-01-13    (1-25]   441
10 2015-01-13   (25-50]   425

Run Code Online (Sandbox Code Playgroud)

如何汇总以找出% Bucket一年中每一年的平均值dplyr？

in base:
x <- as.data.frame(x)
aggregate(count ~ `% Bucket`, data = x, FUN=mean)

% Bucket      count
1       <=1  2609.5294
2    (1-25]   449.0000
3   (25-50]   528.7059
4   (50-75]   593.2157
5  (75-100]   763.0000
6 (100-150]  1758.6667
7      >150 12457.9216

Run Code Online (Sandbox Code Playgroud)

聚合函数将获取 dplyr 在上面每个存储桶中找到的计数，并将它们相加，除以包含该变量的行数% Bucket，并给出上面的答案。我怎样才能用 dplyr 完成这个任务呢？这不是为了完成问题，而是为了了解在这种情况下如何使用 dplyr 包。

此类事物的另一个示例是summarise每个n()变量的group_by，并列出该变量在 52 周内的最小长度“计数”。

我很挣扎，因为 dplyr 似乎是为了查找列中值的平均值而构建的，但在这里我正在计算给定列中变量的行出现次数，并尝试查找平均值、最小值、最大值等。它。

Answer 1

akr*_*run 5

我们可以使用dplyr方法

library(dplyr)
x %>%
   group_by(`% Bucket`) %>%
   summarise(count= mean(count))

Run Code Online (Sandbox Code Playgroud)

归档时间：	10 年，1 月前
查看次数：	6303 次
最近记录：	8 年前