4 machine-learning reinforcement-learning neural-network q-learning deep-learning
强化学习,深度学习和深度强化学习有什么区别?Q-learning适合哪里?
强化学习是指教授代理人使用奖励来导航环境.Q学习是主要的强化学习方法之一.
深度学习使用神经网络来实现某个目标,例如识别图像中的字母和单词.
深度强化学习是两者的结合,以Q学习为基础.但是,这不是使用实际的状态 - 值对,而是经常用于状态 - 动作空间太大以至于Q学习需要很长时间才能收敛的环境中.通过使用神经网络,我们可以找到相似的其他状态 - 动作对.这种"函数逼近"允许在具有非常大的状态动作空间的环境中进行有效学习.
深度学习是一种利用神经网络制作函数逼近器来解决各种问题的方法。例如:学习一个以图像为输入并输出图像中对象的边界框的函数。
强化学习是一个领域,我们有一个代理,我们希望该代理执行一项任务,即基于目标的问题,我们使用试错学习方法。例如:代理学习从网格世界的一个位置移动到目标位置,而不会掉进中间的坑中。
深度强化学习是一种使用神经网络解决基于目标的问题的方法。这是因为,当我们希望代理在现实世界或当前游戏中执行任务时,状态空间非常大。代理甚至访问每个状态一次都需要很长时间,我们不能使用查找表来存储值函数。因此,为了解决这个问题,我们使用神经网络来逼近状态以概括学习过程 例如:我们使用 DQN 来解决许多 atari 游戏。
Q-learning:它是一种时间差异学习方法,我们有一个 Q-table 来根据 Q 值函数寻找当前状态下可能的最佳动作。为了学习 Q 值,我们使用奖励和最大可能的下一个状态 Q 值。
Q-learning 基本上属于强化学习,它的深度强化学习类似物是 Deep Q 网络(DQN)。
归档时间: |
|
查看次数: |
729 次 |
最近记录: |