我有一个简单的数据集,其中有一个日期列和一个值列。我注意到日期有时采用 mmddyy (%m/%d/%y) 格式,有时采用 mmddYYYY (%m/%d/%Y) 格式。标准化日期的最佳方法是什么,以便我可以进行其他计算而不会导致这种格式出现问题?
我尝试了此处提供的答案 更改 R 中的日期格式
在这里 如何更改同一列中的多个日期格式
这些都无法解决问题。
以下是数据示例
Date, Market
12/17/09,1.703
12/18/09,1.700
12/21/09,1.700
12/22/09,1.590
12/23/2009,1.568
12/24/2009,1.520
12/28/2009,1.500
12/29/2009,1.450
12/30/2009,1.450
12/31/2009,1.450
1/4/2010,1.440
Run Code Online (Sandbox Code Playgroud)
当我使用类似的东西将其读入新向量时
dt <- as.Date(inp$Date, format="%m/%d/%y")
Run Code Online (Sandbox Code Playgroud)
我得到上述段的以下输出
dt Market
2009-12-17 1.703
2009-12-18 1.700
2009-12-21 1.700
2009-12-22 1.590
2020-12-23 1.568
2020-12-24 1.520
2020-12-28 1.500
2020-12-29 1.450
2020-12-30 1.450
2020-12-31 1.450
2020-01-04 1.440
Run Code Online (Sandbox Code Playgroud)
正如您所看到的,由于格式发生变化,我们在 12 月 23 日从 2009 年跳到了 2020 年。任何帮助表示赞赏。谢谢。
> dat$Date <- gsub("[0-9]{2}([0-9]{2})$", "\\1", dat$Date)
> dat$Date <- as.Date(dat$Date, format = "%m/%d/%y")
> dat
Date Market
# 1 2009-12-17 1.703
# 2 2009-12-18 1.700
# 3 2009-12-21 1.700
# 4 2009-12-22 1.590
# 5 2009-12-23 1.568
# 6 2009-12-24 1.520
# 7 2009-12-28 1.500
# 8 2009-12-29 1.450
# 9 2009-12-30 1.450
# 10 2009-12-31 1.450
# 11 2010-01-04 1.440
Run Code Online (Sandbox Code Playgroud)