用于将字符向量转换为POSIXct/POSIXlt的as.POSIXct/as.POSIXlt和strptime之间的区别

RJ-*_*RJ- 89 time benchmarking r date

我在这里跟了一些问题,询问如何将字符向量转换为datetime类.我经常看到2种方法,strptime和as.POSIXct/as.POSIXlt方法.我看了两个函数,但不清楚区别是什么.

strptime

function (x, format, tz = "") 
{
    y <- .Internal(strptime(as.character(x), format, tz))
    names(y$year) <- names(x)
    y
}
<bytecode: 0x045fcea8>
<environment: namespace:base>
Run Code Online (Sandbox Code Playgroud)

as.POSIXct

function (x, tz = "", ...) 
UseMethod("as.POSIXct")
<bytecode: 0x069efeb8>
<environment: namespace:base>
Run Code Online (Sandbox Code Playgroud)

as.POSIXlt

function (x, tz = "", ...) 
UseMethod("as.POSIXlt")
<bytecode: 0x03ac029c>
<environment: namespace:base>
Run Code Online (Sandbox Code Playgroud)

做一个微基准测试,看看是否存在性能差异:

library(microbenchmark)
Dates <- sample(c(dates = format(seq(ISOdate(2010,1,1), by='day', length=365), format='%d-%m-%Y')), 5000, replace = TRUE)
df <- microbenchmark(strptime(Dates, "%d-%m-%Y"), as.POSIXlt(Dates, format = "%d-%m-%Y"), times = 1000)

Unit: milliseconds
                                    expr      min       lq   median       uq      max
1 as.POSIXlt(Dates, format = "%d-%m-%Y") 32.38596 33.81324 34.78487 35.52183 61.80171
2            strptime(Dates, "%d-%m-%Y") 31.73224 33.22964 34.20407 34.88167 52.12422
Run Code Online (Sandbox Code Playgroud)

strptime似乎稍微快一些.什么赋予了什么?为什么会有2个类似的功能或者我错过了它们之间的区别?

Fhn*_*oag 144

嗯,功能做了不同的事情.

首先,有两个日期/时间的内部实现:POSIXct它存储自UNIX纪元以来的秒数(+一些其他数据),并POSIXlt存储日,月,年,小时,分钟,秒等的列表.

strptime是一种将字符向量(各种格式)直接转换为格式的函数POSIXlt.

as.POSIXlt将各种数据类型转换为POSIXlt.它试图变得聪明并且做出明智的事情 - 在角色的情况下,它充当了一个包装器strptime.

as.POSIXct将各种数据类型转换为POSIXct.它还试图成为智能,做合理的事情-在字符的情况下,它运行strptime,然后再从执行转换POSIXltPOSIXct.

有意义的strptime是更快,因为strptime只处理字符输入,而其他人尝试从输入类型确定使用哪种方法.它应该更安全一点,因为交付意外数据只会给出错误,而不是试图做出可能不是你想要的智能事物.


小智 19

有两种POSIXt类型,POSIXct和POSIXlt."ct"可以代表日历时间,它存储自原点以来的秒数."lt"或本地时间将日期保留为时间属性列表(例如"小时"和"星期一").试试这些例子:

date.hour=strptime("2011-03-27 01:30:00", "%Y-%m-%d %H:%M:%S")

date=c("26/10/2016")

time=c("19:51:30")

day<-paste(date,"T", time)

day.time1=as.POSIXct(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")

day.time1

day.time1$year

day.time2=as.POSIXlt(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")

day.time2

day.time2$year
Run Code Online (Sandbox Code Playgroud)