T0m*_*T0m 4 neural-network pybrain
正如问题所述,我正在为pybrain中的强化学习寻找一个很好的解释/示例,因为关于此的文档让我感到困惑,我可以让它工作,但我不明白如何将它应用于其他事情.
谢谢汤姆
不幸的是,pybrain的rl类文档令人失望.我发现这个博客非常有用.
总之,您需要识别以下组件(有关实现的详细信息,请参阅链接上的教程):
env = Environment(...)task = Task(env)controller = Module(...)learner = SARSA()- >您还可以向学习者添加资源管理器.默认值为epsilon-greedy,epsilon = 0.3,衰减= 0.9999.agent = Agent(controller, learner)experiment = Experiment(task, agent)每个大写的类都应该用PyBrain中的相应类替换.然后你只需运行一个do-while循环来执行迭代和学习.请注意,用户可以设置几个选项,在实际问题中,您最有可能需要编写子类来概括pybrain的基本类,但步骤与此处的步骤相同.