如何为随机森林算法准备循环序数特征,例如一天中的时间或一周中的一天?
仅用午夜后的分钟来编码时间,23:55 和 00:05 之间的信息差异将非常大,尽管只有 10 分钟的差异。
我在这里找到了一个解决方案,其中使用午夜后秒数特征的余弦和正弦将时间特征分为两个特征。但这适合随机森林吗?使用随机森林时,无法确定每次分割都会出现所有特征。通常,决策时有一半的时间会缺少信息。
期待您的想法!
machine-learning random-forest feature-engineering
feature-engineering ×1
machine-learning ×1
random-forest ×1