在R中将字符转换为日期

Bti*_*rt3 28 r lubridate

我对R来说比较新,但这是我第一次不得不处理日期转换.我从CSV读取数据(使用read.table()),但我缩短了数据以突出显示我的问题.当读入R时,Date字段是字符.

简单地说,我的大多数日期都被正确强制,除了少数情况.下面的例子有望向您展示正在发生的事情.

# my attempt to coerce the date -- uses the stringr package
prods.all$Date2 <- as.Date(str_sub(prods.all$Date, 1, 
                str_locate(prods.all$Date, " ")[1]-1), 
                "%m/%d/%Y")

# grab two rows to highlight my issue
temp <- prods.all[c(1925:1926), c(1,8)]

> temp
                   Date      Date2
1925  10/9/2009 0:00:00 2009-10-09
1926 10/15/2009 0:00:00 0200-10-15
Run Code Online (Sandbox Code Playgroud)

如您所见,某些日期的年份不准确.当这一天是两位数时,似乎会出现这种模式.

我查看了几本书并尝试了Google更好的方法,但似乎所有内容都表明我的数据在输入时格式不正确.

鉴于R有多强大,我认为有一种非常简单的方法可以强制我的专栏成为有效的日期,而且我忽略了一个非常明显的解决方案.

我们将非常感谢您提供的任何帮助.

had*_*ley 64

最简单的方法是使用lubridate:

library(lubridate)
prods.all$Date2 <- mdy(prods.all$Date2)
Run Code Online (Sandbox Code Playgroud)

此函数自动返回类的对象,POSIXct并将使用因子或字符.

  • 我将在该库中提及ymd(),ymd_hms(),myd_hms()等等的存在,以便一起处理日期和时间字段.很棒的图书馆顺便说一句.我的帽子给你了... (11认同)
  • lubridate是一个很棒的软件包。在2018年仍在使用它,并且用不完。https://github.com/rstudio/cheatsheets/raw/master/lubridate.pdf上有一个'lubridate'备忘单 (3认同)

mds*_*ner 48

你可能会过度复杂化,有什么理由需要stringr包吗?

 df <- data.frame(Date = c("10/9/2009 0:00:00", "10/15/2009 0:00:00"))
 as.Date(df$Date, "%m/%d/%Y %H:%M:%S")
Run Code Online (Sandbox Code Playgroud)

[1]"2009-10-09""2009-10-15"

更一般地说,如果您还需要时间组件,请使用strptime:

strptime(df$Date, "%m/%d/%Y %H:%M:%S")
Run Code Online (Sandbox Code Playgroud)

我猜你的实际数据可能会从你给出的部分结果中看出来.