Pybrain强化学习实例

Question

正如问题所述,我正在为pybrain中的强化学习寻找一个很好的解释/示例,因为关于此的文档让我感到困惑,我可以让它工作,但我不明白如何将它应用于其他事情.

谢谢汤姆

Answer 1

不幸的是,pybrain的rl类文档令人失望.我发现这个博客非常有用.

总之,您需要识别以下组件(有关实现的详细信息,请参阅链接上的教程):

一个环境: env = Environment(...)
任务 - > task = Task(env)
控制器,它是一个模块(如表),用于保存您的操作值信息 - > controller = Module(...)
学习者 - > learner = SARSA()- >您还可以向学习者添加资源管理器.默认值为epsilon-greedy,epsilon = 0.3,衰减= 0.9999.
集成控制器和学习器的代理 - > agent = Agent(controller, learner)
集成任务和代理并进行实际迭代的实验 - > experiment = Experiment(task, agent)

每个大写的类都应该用PyBrain中的相应类替换.然后你只需运行一个do-while循环来执行迭代和学习.请注意,用户可以设置几个选项,在实际问题中,您最有可能需要编写子类来概括pybrain的基本类,但步骤与此处的步骤相同.