我有一个带有日期时间和值(在 0 和 1 之间)的 data.frame,我想找到value=1 per day的第一次出现。
df <- read.table(header = TRUE, text = '
Datetime Value
"2016-12-01 23:45:00" 0
"2016-12-01 23:50:00" 1
"2016-12-02 00:05:00" 1
"2016-12-02 00:10:00" 0
"2016-12-03 04:10:00" 0
"2016-12-03 04:15:00" 0
"2016-12-04 12:10:00" 1
"2016-12-04 12:15:00" 1
')
df$Datetime <- as.POSIXct(df$Datetime, "%Y-%m-%d %H:%M:%S", tz="UTC")
View(df)
Run Code Online (Sandbox Code Playgroud)
我想要的是:
2016-12-01 23:50:00 1
2016-12-02 00:05:00 1
2016-12-04 12:10:00 1
Run Code Online (Sandbox Code Playgroud)
我试图用 match() 和 aggregate() 解决问题,但到目前为止还没有运气。此外,我能够用 for 循环解决问题,但它是 a) 非常慢并且 b) 可能不是它本来的样子。
一个替代方案dplyr:
library(dplyr)
df %>%
#group
group_by(as.Date(Datetime)) %>%
#select only those where value equals 1
filter(Value == 1) %>%
#get only the first row
slice(1) %>%
#ungroup
ungroup %>%
#select columns
select(Datetime, Value)
Run Code Online (Sandbox Code Playgroud)
输出:
# A tibble: 3 x 2
Datetime Value
<time> <int>
1 2016-12-01 23:50:00 1
2 2016-12-02 00:05:00 1
3 2016-12-04 12:10:00 1
Run Code Online (Sandbox Code Playgroud)
或者根据@Akrun 的评论:
df %>%
group_by(Date = as.Date(Datetime)) %>%
slice(which(Value==1)[1])
Run Code Online (Sandbox Code Playgroud)