我有以下日期:
my_dataset <- tibble(my_date = c("03-05-2020", "04-05-2020", "05-05-2020", "06-05-2020"))
Run Code Online (Sandbox Code Playgroud)
我想创建一个名为的新列,nice_dates其日期格式为:dd/mm/yyyy格式,所以我最终会得到如下结果:
my_date | nice_dates
03-05-2020 | 03/05/2020
04-05-2020 | 04/05/2020
05-05-2020 | 05/05/2020
06-05-2020 | 06/05/2020
Run Code Online (Sandbox Code Playgroud)
我尝试过使用 lubridate pacakge,但在定义新格式时遇到困难,我知道它应该是“%d/%m/%Y”,但是使用 as.Date() 会产生 NA。
我应该只使用 gsub 吗?
@ThoVu 就快到了。因此,为了完整起见,一个更简单的答案,仅使用基本 R。
代码## input data as before
df <- data.frame(my_date = c("03-05-2020", "04-05-2020",
"05-05-2020", "06-05-2020"))
## create Date objects using base R
df$parsed <- strptime(df$my_date, "%d-%m-%Y")
## format them to spec
df$nice_dates <- format(df$parsed, "%d/%m/%Y")
Run Code Online (Sandbox Code Playgroud)
输出
R> df <- data.frame(my_date = c("03-05-2020", "04-05-2020",
"05-05-2020", "06-05-2020"))
R> df$parsed <- strptime(df$my_date, "%d-%m-%Y")
R> df$nice_dates <- format(df$parsed, "%d/%m/%Y")
R> df
my_date parsed nice_dates
1 03-05-2020 2020-05-03 03/05/2020
2 04-05-2020 2020-05-04 04/05/2020
3 05-05-2020 2020-05-05 05/05/2020
4 06-05-2020 2020-05-06 06/05/2020
R>
Run Code Online (Sandbox Code Playgroud)
我的一般建议是,当您可以使用适当的日期解析器时,永远不要对日期输入使用字符串操作或正则表达式。