use*_*820 7 regression neural-network one-hot-encoding
我知道在训练机器学习算法之前,分类数据应该是单热编码的.我还需要对于多元线性回归我需要排除其中一个编码变量以避免所谓的虚拟变量陷阱.
例如:如果我有分类功能"大小":"小","中","大",那么在一个热编码我会有类似的东西:
small medium large other-feature
0 1 0 2999
Run Code Online (Sandbox Code Playgroud)
因此,为了避免虚拟变量陷阱,我需要删除3列中的任何一列,例如,列"小".
我是否应该为训练神经网络做同样的事情?或者这纯粹是为了多元回归?
谢谢.