从 R 中的文本中提取任何格式的日期

rac*_*hit 0 datetime text-extraction r text-mining

我想从给定的文本中提取日期,日期可以是任何格式 2018 年 4 月 10 日、10-04-2018、10/04/2018、2018/04/10、04.10.2018,就像其他格式一样......

我有新闻数据,想从文本中提取日期

例如:我的朋友将于 2018 年 7 月 10 日或 10/07/2018 来

我想从给定的文本中 提取日期

请帮忙

提前致谢

akr*_*run 6

我们使用str_extract然后使用anydate获取格式提取它

library(anytime)
library(stringr)
anydate(str_extract_all(str1, "[[:alnum:]]+[ /]*\\d{2}[ /]*\\d{4}")[[1]])
#[1] "2018-07-10" "2018-10-07"
Run Code Online (Sandbox Code Playgroud)

数据

str1 <- "My Friend is coming on july 10 2018 or 10/07/2018"
Run Code Online (Sandbox Code Playgroud)