没有训练价值的神经网络学习

Bum*_*imp 2 machine-learning reinforcement-learning neural-network

我想知道如何在不提供训练值的情况下训练神经网络.我的前提是神经网络将用于可以从传感器接收正/负反馈的机器人.IE,为了训练它自由地漫游而不碰到东西,当没有触发碰撞传感器或接近传感器时会发生正反馈.当碰撞/接近传感器被触发时发生负反馈.如何使用这种方法训练神经网络?

我是用C++写的

Don*_*eba 5

你描述的是强化学习.它可以应用于神经网络,但一般不需要它们.阅读该主题的规范教科书是强化学习: Richard Sutton和Andrew Barto的介绍.James McClelland 在PDP手册中更详细地探讨了神经网络与强化学习之间的联系.