神经网络:处理不可用的输入(丢失或不完整的数据)

Mic*_*eal 10 machine-learning neural-network

希望这个周末你能从我这里得到最后一个NN问题,但是这里有:)

有没有办法处理你"并不总是知道"的输入...所以它不会以某种方式影响权重?

所以......如果我问某人是男性还是女性而且他们不想回答,有没有办法忽视这些意见?也许把它直接放在中心?(假设1,0输入为0.5?)

谢谢

dou*_*oug 8

您可能知道这一点或怀疑它,但是通过对可能值的范围进行平均来猜测或提供缺失值没有统计依据等.

特别是对于NN,有很多技术可供选择.我使用的技术 - 我编码 - 是一种更简单的技术,但它有一个坚实的统计基础,现在仍然使用.在这里描述它的学术论文.

这种技术的基础理论是对整数数据的加权积分.在实践中,没有评估积分,而是通过高斯基函数网络的闭合解来近似它们.正如您将在本文中看到的那样(这是一个逐步的解释,在您的backprop算法中实现起来很简单.


Dan*_*l G 6

神经网络对噪声具有相当的抵抗力——这是它们的一大优势。不过,您可能想尝试将输入置于 (-1.0,1.0) 处,将 0 作为非输入输入。这样,来自该神经元的权重输入为 0.0,这意味着在那里不会发生学习。

可能我不幸没有完成(尚未完成!)的最好的书是Simon S. Haykin 的Neural Networks and Learning Machines。在其中,他谈到了各种问题,包括您应该如何分配输入/训练集以获得最佳训练等。这是一本非常棒的书!