强化学习的良好实施?

bdd*_*bdd 22 language-agnostic artificial-intelligence machine-learning reinforcement-learning

对于一个ai级项目,我需要实现一个强化学习算法,该算法击败了一个简单的俄罗斯方块游戏.游戏是用Java编写的,我们有源代码.我知道强化学习理论的基础知识,但是想知道SO社区中是否有人亲身体验过这类事情.

  1. 对于在俄罗斯方块游戏中实施强化学习,您的推荐读数是什么?
  2. 是否有任何良好的开源项目可以完成类似的事情,值得一试?

编辑:越具体越好,但欢迎关于该主题的一般资源.

跟进:

我觉得如果我发布一个后续内容会很好.

这是我为任何未来的学生最终得到的解决方案(代码和写作):).

/代码

and*_*otn 13

看看2009年的RL比赛.其中一个问题领域是俄罗斯方块游戏.前一年也有一个俄罗斯方块问题.这是该年度第五名决赛入围者的52页最终报告,其中详细介绍了该代理人的工作方式.