我正在处理自1993年以来巴西指数(IBOV)的每日回报,我试图找出两个日期之间的子集的最佳方法.
数据框(IBOV_RET
)如下:
head(IBOV_RET)
DATE 1D_RETURN
1 1993-04-28 -0.008163265
2 1993-04-29 -0.024691358
3 1993-04-30 0.016877637
4 1993-05-03 0.000000000
5 1993-05-04 0.033195021
6 1993-05-05 -0.012048193
...
Run Code Online (Sandbox Code Playgroud)
我设置了2个变量DATE1
和DATE2
日期
DATE1 <- as.Date("2014-04-01")
DATE2 <- as.Date("2014-05-05")
Run Code Online (Sandbox Code Playgroud)
我能够使用以下代码创建一个新的子集:
TEST <- IBOV_RET[IBOV_RET$DATE >= DATE1 & IBOV_RET$DATE <= DATE2,]
Run Code Online (Sandbox Code Playgroud)
它工作,但我想知道是否有更好的方法来分配2日期之间的数据,也许使用subset
.
tal*_*lat 21
正如@MrFlick已经指出的那样,你没有绕过子集化的基本逻辑.一种方法,使您更容易进行子集特定data.frame是定义一个函数,它有两个输入端一样DATE1
,并DATE2
在你的榜样,然后返回的子集,IBOV_RET
根据这些子集的参数.
myfunc <- function(x,y){IBOV_RET[IBOV_RET$DATE >= x & IBOV_RET$DATE <= y,]}
DATE1 <- as.Date("1993-04-29")
DATE2 <- as.Date("1993-05-04")
Test <- myfunc(DATE1,DATE2)
#> Test
# DATE X1D_RETURN
#2 1993-04-29 -0.02469136
#3 1993-04-30 0.01687764
#4 1993-05-03 0.00000000
#5 1993-05-04 0.03319502
Run Code Online (Sandbox Code Playgroud)
您还可以直接输入特定日期myfunc
:
myfunc(as.Date("1993-04-29"),as.Date("1993-05-04")) #will produce the same result
Run Code Online (Sandbox Code Playgroud)
您可以将此subset()
功能与&
操作员一起使用:
subset(IBOV_RET, DATE1> XXXX-XX-XX & DATE2 < XXXX-XX-XX)
Run Code Online (Sandbox Code Playgroud)
更新为更"面向游戏"的方法:
IBOV_RET %>%
filter(DATE1 > XXXX-XX-XX, DATE2 < XXXX-XX-XX) #comma same as &
Run Code Online (Sandbox Code Playgroud)