计算R中的时差

use*_*490 23 datetime r

我有一个数据超过300万条记录,其中start.time和end.time是两个变量.前10个障碍如下:

   start.date start.time   end.date end.time
1  2012-07-13   15:01:32 2012-07-13 15:02:42
2  2012-07-05   18:26:31 2012-07-05 18:27:19
3  2012-07-14   20:23:21 2012-07-14 20:24:11
4  2012-07-29   16:09:54 2012-07-29 16:10:48
5  2012-07-21   14:58:32 2012-07-21 15:00:17
6  2012-07-04   15:36:31 2012-07-04 15:37:11
7  2012-07-22   18:28:31 2012-07-22 18:28:50
8  2012-07-09   21:08:42 2012-07-09 21:09:02
9  2012-07-05   09:44:52 2012-07-05 09:45:05
10 2012-07-02   18:50:47 2012-07-02 18:51:38
Run Code Online (Sandbox Code Playgroud)

我需要计算start.time和end.time之间的差异.

我使用了以下代码:

mbehave11$diff.time <- difftime(mbehave11$end.time, mbehave11$start.time, units="secs")
Run Code Online (Sandbox Code Playgroud)

但是我收到了这个错误:

Error in as.POSIXlt.character(x, tz, ...) : 
  character string is not in a standard unambiguous format
In addition: Warning messages:
1: In is.na.POSIXlt(strptime(xx, f <- "%Y-%m-%d %H:%M:%OS", tz = tz)) :
  Reached total allocation of 1535Mb: see help(memory.size)
Run Code Online (Sandbox Code Playgroud)

Dir*_*tel 40

必须把你的字符串为日期对象,你可以做日期/时间算术运算之前.试试这个:

a)阅读您的数据:

R> dat <- read.table(textConnection("start.date start.time end.date end.time
2012-07-13   15:01:32 2012-07-13 15:02:42
2012-07-05   18:26:31 2012-07-05 18:27:19 
2012-07-14   20:23:21 2012-07-14 20:24:11"), header=TRUE) 
Run Code Online (Sandbox Code Playgroud)

b)进行一项观察:

 R>  strptime( paste(dat[,1], dat[,2]), "%Y-%m-%d %H:%M:%S")
 [1] "2012-07-13 15:01:32" "2012-07-05 18:26:31" "2012-07-14 20:23:21" 
Run Code Online (Sandbox Code Playgroud)

c)处理集合,转换为数字:

 R> as.numeric(difftime(strptime(paste(dat[,1],dat[,2]),"%Y-%m-%d %H:%M:%S"),
                        strptime(paste(dat[,3],dat[,4]),"%Y-%m-%d %H:%M:%S"))) 
 [1] -70 -48 -50
 R> 
Run Code Online (Sandbox Code Playgroud)

  • 参见`help(difftime)` - 有一个单位参数,默认为秒,你可以覆盖它.但是要检查一下,在第一行看-70并想一下你设置的第一行的时差是:七十秒.如果你想要minuts,使用`units ="min"`).就这么简单. (9认同)

clo*_*tes 6

我认为您可以使用 lubridate 包,
它有一个名为 ymd_hms 的方法,
您可以使用它从字符串获取时间:对于大数据集来说要快得多

library(lubridate)
dat <- read.table(textConnection("start.date start.time end.date end.time
2012-07-13   15:01:32 2012-07-13 15:02:42
2012-07-05   18:26:31 2012-07-05 18:27:19 
2012-07-14   20:23:21 2012-07-14 20:24:11"), header=TRUE)
starttime = ymd_hms(paste(dat[,1], dat[,2]))
endtime = ymd_hms(paste(dat[,3], dat[,4]))
interval = difftime(endtime,starttime,units = "secs")
Run Code Online (Sandbox Code Playgroud)

或者你可以只用一行来做,但对于大数据集需要更长的时间:

difftime(paste(dat[,3], dat[,4]),paste(dat[,1], dat[,2]),units = "secs")
Run Code Online (Sandbox Code Playgroud)