小编Max*_*Max的帖子

随机森林中的循环序数特征

如何为随机森林算法准备循环序数特征,例如一天中的时间或一周中的一天?

仅用午夜后的分钟来编码时间,23:55 和 00:05 之间的信息差异将非常大,尽管只有 10 分钟的差异。

我在这里找到了一个解决方案,其中使用午夜后秒数特征的余弦和正弦将时间特征分为两个特征。但这适合随机森林吗?使用随机森林时,无法确定每次分割都会出现所有特征。通常,决策时有一半的时间会缺少信息。

期待您的想法!

machine-learning random-forest feature-engineering

5
推荐指数
1
解决办法
1102
查看次数