Pybrain强化学习实例

T0m*_*T0m 4 neural-network pybrain

正如问题所述,我正在为pybrain中的强化学习寻找一个很好的解释/示例,因为关于此的文档让我感到困惑,我可以让它工作,但我不明白如何将它应用于其他事情.

谢谢汤姆

Meh*_*hdi 9

不幸的是,pybrain的rl类文档令人失望.我发现这个博客非常有用.


总之,您需要识别以下组件(有关实现的详细信息,请参阅链接上的教程):

  1. 一个环境: env = Environment(...)
  2. 任务 - > task = Task(env)
  3. 控制器,它是一个模块(如表),用于保存您的操作值信息 - > controller = Module(...)
  4. 学习者 - > learner = SARSA()- >您还可以向学习者添加资源管理器.默认值为epsilon-greedy,epsilon = 0.3,衰减= 0.9999.
  5. 集成控制器和学习器的代理 - > agent = Agent(controller, learner)
  6. 集成任务和代理并进行实际迭代的实验 - > experiment = Experiment(task, agent)

每个大写的类都应该用PyBrain中的相应类替换.然后你只需运行一个do-while循环来执行迭代和学习.请注意,用户可以设置几个选项,在实际问题中,您最有可能需要编写子类来概括pybrain的基本类,但步骤与此处的步骤相同.