强化学习的良好实施？

Question

对于一个ai级项目,我需要实现一个强化学习算法,该算法击败了一个简单的俄罗斯方块游戏.游戏是用Java编写的,我们有源代码.我知道强化学习理论的基础知识,但是想知道SO社区中是否有人亲身体验过这类事情.

编辑:越具体越好,但欢迎关于该主题的一般资源.

跟进:

我觉得如果我发布一个后续内容会很好.

这是我为任何未来的学生最终得到的解决方案(代码和写作):).

Answer 1

看看2009年的RL比赛.其中一个问题领域是俄罗斯方块游戏.前一年也有一个俄罗斯方块问题.这是该年度第五名决赛入围者的52页最终报告,其中详细介绍了该代理人的工作方式.