小编Sus*_*ins的帖子

如何解释 dplyr 消息“summarise()”通过“x”重新分组输出(用“.groups”参数覆盖)?

在更新到 dplyr 开发版本 0.8.99.9003 后运行 group_by 和 summarise() 时,我开始收到一条新消息(见帖子标题)。

以下是重新创建输出的示例:

library(tidyverse)
library(hablar)
df <- read_csv("year, week, rat_house_females, rat_house_males, mouse_wild_females, mouse_wild_males 
               2018,10,1,1,1,1
               2018,10,1,1,1,1
               2018,11,2,2,2,2
               2018,11,2,2,2,2
               2019,10,3,3,3,3
               2019,10,3,3,3,3
               2019,11,4,4,4,4
               2019,11,4,4,4,4") %>% 
  convert(chr(year,week)) %>% 
  mutate(total_rodents = rowSums(select_if(., is.numeric))) %>% 
  convert(num(year,week)) %>% 
  group_by(year,week) %>% summarise(average = mean(total_rodents))
Run Code Online (Sandbox Code Playgroud)

输出 tibble 是正确的,但出现此消息:

summarise()按“年份”重新分组输出(用.groups参数覆盖)

这应该如何解释?当我按年和周分组时,为什么它只报告按“年”重新分组?另外,覆盖是什么意思,我为什么要这样做?

我不认为该消息表明存在问题,因为它出现在整个 dplyr 小插图中:https ://cran.r-project.org/web/packages/dplyr/vignettes/programming.html

我相信这是一条新消息,因为它只出现在最近的 SO 问题上,例如如何使用 dplyr 融化pairwise.wilcox.test 输出?R 聚合多列(都没有解决重组/覆盖消息)。

谢谢!

r dplyr summarize

161
推荐指数
2
解决办法
10万
查看次数

当 cols = 任何以特定前缀开头的列时,如何使用 tidyr hub_longer

每周,我都会收到一个原始数据集,我需要从中生成报告。我想编写一个每周都能运行的 R 脚本。不幸的是,根据收集的样本,原始数据每周的列组略有不同。这是每周的情况的示例。

library(readr)
w1 <- read_csv("species, males, females - fed, females - unfed
a,2,0,3
b,5,7,2
c,8,4,9")
w2 <- read_csv("species, males, females - mixed
a,2,0
b,5,7
c,8,4")

> w1
# A tibble: 3 x 4
  species males `females - fed` `females - unfed`
  <chr>   <dbl>           <dbl>             <dbl>
1 a           2               0                 3
2 b           5               7                 2
3 c           8               4                 9
> w2
# A tibble: 3 x 3
  species males `females - mixed`
  <chr>   <dbl>             <dbl>
1 a …
Run Code Online (Sandbox Code Playgroud)

select r names startswith dplyr

5
推荐指数
1
解决办法
4958
查看次数

标签 统计

dplyr ×2

r ×2

names ×1

select ×1

startswith ×1

summarize ×1