小编Paj*_*ajh的帖子

蒙特卡洛树搜索 - 处理游戏结束节点

我已经为 4 人游戏实现了 MCTS,该游戏运行良好,但当游戏结束移动位于实际树中而不是在推出中时,我不确定我是否理解扩展。

在游戏开始时,游戏获胜/失败的位置只能在推出中找到,我了解如何对这些进行评分并将它们传播回树上。但随着游戏的进行,我最终找到了一个由 UCB1 选择的叶节点,它无法扩展,因为它是一个失败的位置,不允许任何移动,因此没有任何东西可以扩展,也没有游戏可以“推出”。目前,我只是将此视为最后剩下的玩家的“胜利”,并为他们反向传播胜利。

然而,当我查看访问统计信息时,该节点被重新访问了数千次,因此显然 UCB1“选择”多次访问该节点,但实际上这有点浪费,我是否应该反向传播除单个节点之外的其他内容赢得这些“永远获胜”的节点?

我对此进行了很好的谷歌搜索,但找不到太多提及它的内容,所以我是否误解了某些东西或遗漏了一些明显的东西,“标准”MCTS教程/算法甚至没有提到树中的游戏结束节点作为特殊情况,所以我担心我误解了一些基本的东西。

artificial-intelligence monte-carlo-tree-search

5
推荐指数
1
解决办法
1079
查看次数