在r中为每个组创建日期序列

Dhe*_*ngh 6 r date seq dplyr

我有一个如下所示的数据集:

      ID    created_at
MUM-0001    2014-04-16
MUM-0002    2014-01-14
MUM-0003    2014-04-17
MUM-0004    2014-04-12
MUM-0005    2014-04-18
MUM-0006    2014-04-17
Run Code Online (Sandbox Code Playgroud)

我正在尝试引入新列,该列将是开始日期和定义的最后一天之间的所有日期(例如,2015年7月12日).我使用了seq函数dplyr但是出错了.

data1 <- data1 %>%
         arrange(ID) %>%
         group_by(ID) %>%
         mutate(date = seq(as.Date(created_at), as.Date('2015-07-12'), by= 1))
Run Code Online (Sandbox Code Playgroud)

我得到的错误是:

错误:大小不兼容(453),期望1(组大小)或1

你能否建议一些更好的方法在R中执行这项任务?

akr*_*run 8

您可以使用data.table来获取sequence从"created_at"到"2015年7月12日",由"ID"列编组日期.

 library(data.table)
 setDT(df1)[, list(date=seq(created_at, as.Date('2015-07-12'), by='1 day')) , ID]
Run Code Online (Sandbox Code Playgroud)

如果您需要选项dplyr,请使用do

 library(dplyr)
 df1 %>% 
   group_by(ID) %>% 
   do( data.frame(., Date= seq(.$created_at,
                            as.Date('2015-07-12'), by = '1 day')))
Run Code Online (Sandbox Code Playgroud)

如果您有重复的ID,那么我们可能需要分组 row_number()

df1 %>%
    group_by(rn=row_number()) %>%
     do(data.frame(ID= .$ID, Date= seq(.$created_at,
          as.Date('2015-07-12'), by = '1 day'), stringsAsFactors=FALSE))
Run Code Online (Sandbox Code Playgroud)

更新

根据@Frank的意见,新的成语tidyverse

library(tidyverse)
df1 %>%
  group_by(ID) %>% 
  mutate(d = list(seq(created_at, as.Date('2015-07-12'), by='1 day')), created_at = NULL) %>%
  unnest()
Run Code Online (Sandbox Code Playgroud)

如果是 data.table

setDT(df1)[, list(date=seq(created_at, 
             as.Date('2015-07-12'), by = '1 day')), by = 1:nrow(df1)] 
Run Code Online (Sandbox Code Playgroud)

数据

df1 <- structure(list(ID = c("MUM-0001", "MUM-0002", "MUM-0003",
 "MUM-0004", 
 "MUM-0005", "MUM-0006"), created_at = structure(c(16176, 16084, 
16177, 16172, 16178, 16177), class = "Date")), .Names = c("ID", 
"created_at"), row.names = c(NA, -6L), class = "data.frame")
Run Code Online (Sandbox Code Playgroud)

  • 我只是用这个作为欺骗目标.整告者告诉我,新的成语是列出一个列表并且不需要它,可能就像`df1%>%group_by(ID)%>%mutate(d = list(seq(created_at,as.Date('2015) -07-12'),by ='1天')),created_at = NULL)%>%unnest()` (2认同)