Bum*_*imp 2 machine-learning reinforcement-learning neural-network
我想知道如何在不提供训练值的情况下训练神经网络.我的前提是神经网络将用于可以从传感器接收正/负反馈的机器人.IE,为了训练它自由地漫游而不碰到东西,当没有触发碰撞传感器或接近传感器时会发生正反馈.当碰撞/接近传感器被触发时发生负反馈.如何使用这种方法训练神经网络?
我是用C++写的
| 归档时间: |
|
| 查看次数: |
2170 次 |
| 最近记录: |