小编Luc*_*uck的帖子

数据框中的杂乱日期格式

我为自己创建了一个我无法解决的任务 - 有一个数据框,其中包含某些项目的开始日期和结束日期.某些元素是错误的,并显示项目的持续时间而不是结束日期.

start_date <- c("2017-05-04", "2016-04-01", "2013-12-12", "2011-05-11", "2010-04-10", "2009-01-01")
end_date <- c("2020-01-01", "2020-01-06", "3 years", "36 months", "2020-01-01", "2020-01-01")
df <- data.frame(start_date, end_date)

start_date   end_date
1 2017-05-04 2020-01-01
2 2016-04-01 2020-01-06
3 2013-12-12    3 years
4 2011-05-11  36 months
5 2010-04-10 2020-01-01
6 2009-01-01 2020-01-01
Run Code Online (Sandbox Code Playgroud)


如何计算它们并转换成日期格式?此外,数据结构start_dateend_date因素.

r dataframe data-cleaning

4
推荐指数
1
解决办法
136
查看次数

标签 统计

data-cleaning ×1

dataframe ×1

r ×1