bdd*_*bdd 22 language-agnostic artificial-intelligence machine-learning reinforcement-learning
对于一个ai级项目,我需要实现一个强化学习算法,该算法击败了一个简单的俄罗斯方块游戏.游戏是用Java编写的,我们有源代码.我知道强化学习理论的基础知识,但是想知道SO社区中是否有人亲身体验过这类事情.
编辑:越具体越好,但欢迎关于该主题的一般资源.
跟进:
我觉得如果我发布一个后续内容会很好.
这是我为任何未来的学生最终得到的解决方案(代码和写作):).