子集两个日期之间的数据帧

Ris*_*ech 30 r date subset

我正在处理自1993年以来巴西指数(IBOV)的每日回报,我试图找出两个日期之间的子集的最佳方法.

数据框(IBOV_RET)如下:

head(IBOV_RET)
        DATE    1D_RETURN
1 1993-04-28 -0.008163265
2 1993-04-29 -0.024691358
3 1993-04-30  0.016877637
4 1993-05-03  0.000000000
5 1993-05-04  0.033195021
6 1993-05-05 -0.012048193
...
Run Code Online (Sandbox Code Playgroud)

我设置了2个变量DATE1DATE2日期

DATE1 <- as.Date("2014-04-01")
DATE2 <- as.Date("2014-05-05")
Run Code Online (Sandbox Code Playgroud)

我能够使用以下代码创建一个新的子集:

TEST <- IBOV_RET[IBOV_RET$DATE >= DATE1 & IBOV_RET$DATE <= DATE2,]
Run Code Online (Sandbox Code Playgroud)

它工作,但我想知道是否有更好的方法来分配2日期之间的数据,也许使用subset.

tal*_*lat 21

正如@MrFlick已经指出的那样,你没有绕过子集化的基本逻辑.一种方法,使您更容易进行子集特定data.frame是定义一个函数,它有两个输入端一样DATE1,并DATE2在你的榜样,然后返回的子集,IBOV_RET根据这些子集的参数.

myfunc <- function(x,y){IBOV_RET[IBOV_RET$DATE >= x & IBOV_RET$DATE <= y,]}

DATE1 <- as.Date("1993-04-29")
DATE2 <- as.Date("1993-05-04")

Test <- myfunc(DATE1,DATE2)    

#> Test
#        DATE  X1D_RETURN
#2 1993-04-29 -0.02469136
#3 1993-04-30  0.01687764
#4 1993-05-03  0.00000000
#5 1993-05-04  0.03319502
Run Code Online (Sandbox Code Playgroud)

您还可以直接输入特定日期myfunc:

myfunc(as.Date("1993-04-29"),as.Date("1993-05-04")) #will produce the same result
Run Code Online (Sandbox Code Playgroud)


Dan*_*Dan 9

您可以将此subset()功能与&操作员一起使用:

subset(IBOV_RET, DATE1> XXXX-XX-XX & DATE2 < XXXX-XX-XX)
Run Code Online (Sandbox Code Playgroud)

更新为更"面向游戏"的方法:

IBOV_RET %>%
  filter(DATE1 > XXXX-XX-XX, DATE2 < XXXX-XX-XX) #comma same as &
Run Code Online (Sandbox Code Playgroud)

  • 您仍然需要使用as.Date()函数包装日期字符串... (2认同)