如何处理变长的特征向量?

jes*_*ems 8 machine-learning

假设您正在尝试根据某些功能对房屋进行分类:

  • 总面积
  • 房间的数量
  • 车库区

但并非所有房屋都有车库.但是当他们这样做时,他们的总面积会产生非常明显的特征.利用此功能中包含的信息有什么好方法?

NPE*_*NPE 5

您可以合并一个零/一个虚拟变量,指示是否有车库,以及车库区域与假人的交叉产品(对于没有车库的房屋,将区域设置为零).

  • 如果你将车库区域设置为零,我不会看到虚拟变量如何改变任何东西.我看到将不存在的车库区域设置为0的问题是它们将被视为类似于非常小的车库,这是不准确的. (2认同)