我有一个类似于以下内容的数据框:
date minutes_since_midnight value
2015-01-01 50 2
2015-01-01 60 1.5
2015-01-02 45 3.3
2015-01-03 99 5.5
Run Code Online (Sandbox Code Playgroud)
和另一个看起来像这样的数据框架
date minutes_since_midnight other_value
2015-01-01 55 12
2015-01-01 80 33
2015-01-02 45 88
Run Code Online (Sandbox Code Playgroud)
我想要做的是添加另一列于第一数据帧,这是布尔值在所述第二数据帧中是否存在在相等的值的行日期列,然后一个minutes_since_midnight其是小于或等于所述minutes_since_midnight从第一个数据框.因此,对于上面的示例数据,我们得到:
date minutes_since_midnight value has_other_value
2015-01-01 50 2 False
2015-01-01 60 1.5 True
2015-01-02 45 3.3 True
2015-01-03 99 5.5 False
Run Code Online (Sandbox Code Playgroud)
我怎样才能做到这一点?
希望这是有道理的,
提前致谢
我可能会沿着另一个答案的行加入data.frames,然后创建变量并删除不需要的列.但是这里有一个选项,使用dplyr包来执行描述它们的步骤:
library(dplyr)
df1$has_other_value <-
left_join(df1, df2 %>%
group_by(date) %>%
summarise(minMins = min(minutes_since_midnight)),
by="date")$minMins <= df1$minutes_since_midnight
df1$has_other_value[is.na(df1$has_other_value)] <- FALSE
Run Code Online (Sandbox Code Playgroud)
结果:
date minutes_since_midnight value has_other_value
1 2015-01-01 50 2.0 FALSE
2 2015-01-01 60 1.5 TRUE
3 2015-01-02 45 3.3 TRUE
4 2015-01-03 99 5.5 FALSE
Run Code Online (Sandbox Code Playgroud)
您是否可以不将变量分钟_since_midnight重命名为分钟_since_midnight1和分钟_since_midnight2,将两个数据框合并在一起,然后使用 if else 语句创建所需的has_other_value变量。