用R表示数据

g_p*_*ffo 1 r bucket dataframe

我将R中的一些数据存储在data.frame中,如下所示:

time     value
53       5
55       5
59       7
61       9
79       6
118      11
200      5
Run Code Online (Sandbox Code Playgroud)

我希望按时间提取数据,制作60秒的桶(时间以秒为单位).但是,我想要做的是创建一个新的data.frame,它只保留每个存储桶的第一个和最后一个条目.我知道我可以通过循环轻松完成这项工作但我的问题是如何告诉R找到存储桶的第1个和最后一个元素.

Mat*_*erg 7

data.table这样方便.在这里,为每分钟的第一个和最后一个值添加列:

xt <- data.table(x)
xt[,first:=head(.SD,1), by=time %/% 60]
xt[,last:=tail(.SD,1), by=time %/% 60]
xt
##    time value first last
## 1:   53     5     5    7
## 2:   55     5     5    7
## 3:   59     7     5    7
## 4:   61     9     9   11
## 5:   79     6     9   11
## 6:  118    11     9   11
## 7:  200     5     5    5
Run Code Online (Sandbox Code Playgroud)

这是一个简单的方法来修剪到分钟桶.修改time列以指示分钟的头部,删除value列,然后传递给unique:

xt$time <- 60 * xt$time %/% 60
xt$value <- NULL
unique(xt)
##    time first last
## 1:    0     5    7
## 2:   60     9   11
## 3:  180     5    5
Run Code Online (Sandbox Code Playgroud)

要获得每分钟中第一行和最后一行的时间和值,aggregate.data.frame效果很好,但需要两次通过.

第一个值:

aggregate(cbind(time, value) ~ time %/% 60, data=x, FUN=head, 1)
##   time%/%60 time value
## 1         0   53     5
## 2         1   61     9
## 3         3  200     5
Run Code Online (Sandbox Code Playgroud)

最后的价值:

aggregate(cbind(time, value) ~ time %/% 60, data=x, FUN=tail, 1)
##   time%/%60 time value
## 1         0   59     7
## 2         1  118    11
## 3         3  200     5
Run Code Online (Sandbox Code Playgroud)

然后可以将它们组合成所需的输出.