ifelse()函数-参考第二天

Tob*_*Kel 6 r lubridate tibble

我有一个包含2列的数据框:日期和返回值。

df <- tibble( 
date = lubridate::today() +0:9,
return= c(1,2.5,2,3,5,6.5,1,9,3,2))
Run Code Online (Sandbox Code Playgroud)

现在,我想添加第三列,条件为ifelse。如果第t天的收益大于3.5,则第二天t + 1的重运行为NA(否则=第t天的收益)。

这是我想要的输出:

date         return      retrun_subsequent_day
<date>       <dbl>       <dbl>
1 2019-03-14    1        1
2 2019-03-15    2.5      2.5
3 2019-03-16    2        2
4 2019-03-17    3        3
5 2019-03-18    5        5
6 2019-03-19    6.5      NA
7 2019-03-20    1        NA
8 2019-03-21    9        9
9 2019-03-22    3        NA
10 2019-03-23   2        2
Run Code Online (Sandbox Code Playgroud)

有人可以描述我如何制定这种条件吗?

akr*_*run 6

一种base R方法是创建“ return”的副本作为新列“ return_sub”,然后使用数字索引('i1')将值分配给NA

i1 <- which(df$return > 3.5)
df$return_subsequent_day <- df$return
df$return_subsequent_day[pmin(i1 +1, nrow(df))] <- NA
df$return_subsequent_day
#[1] 1.0 2.5 2.0 3.0 5.0  NA  NA 9.0  NA 2.0
Run Code Online (Sandbox Code Playgroud)


bre*_*usn 6

使用lagmutate来自dplyr。使用lag时,我们将return前一行的-value与3.5:进行比较:如果大于或等于,则采用NA;如果较小,则采用当前行的返回值

library(dplyr)

df <- df %>% mutate(return_subsequent_day = ifelse(lag(return, default = 0) >= 3.5, NA, return))
Run Code Online (Sandbox Code Playgroud)

输出:

# A tibble: 10 x 3
   date       return return_subsequent_day
   <date>      <dbl>                 <dbl>
 1 2019-03-14    1                     1  
 2 2019-03-15    2.5                   2.5
 3 2019-03-16    2                     2  
 4 2019-03-17    3                     3  
 5 2019-03-18    5                     5  
 6 2019-03-19    6.5                  NA  
 7 2019-03-20    1                    NA  
 8 2019-03-21    9                     9  
 9 2019-03-22    3                    NA  
10 2019-03-23    2                     2  
Run Code Online (Sandbox Code Playgroud)