小编ukd*_*hub的帖子

如何在机器学习数据预处理中处理日期变量

我有一个数据集,其中包含其他变量的事务时间戳,格式为26-09-2017 15:29:32.我需要找到销售的可能相关性和预测(比如在逻辑回归中).我的问题是:

  1. 如何处理日期格式?我可以将它转换为一个数字(如excel自动执行)吗?我应该把它分成更多变量,如日,月,年,小时,分钟,秒?任何其他可能的建议?
  2. 如果我想每年添加不同的周数怎么办?我应该添加变量如342017(2017年第34周)?
  3. 我可以在第二季的问题2中做同样的事情吗?
#         Datetime               Gender        Purchase
1    23/09/2015 00:00:00           0             1
2    23/09/2015 01:00:00           1             0
3    25/09/2015 02:00:00           1             0
4    27/09/2015 03:00:00           1             1
5    28/09/2015 04:00:00           0             0
Run Code Online (Sandbox Code Playgroud)

python r machine-learning feature-selection logistic-regression

9
推荐指数
2
解决办法
1万
查看次数