CIP*_*IPU 3 javascript machine-learning tic-tac-toe minimax alpha-beta-pruning
我使用 Minimax 和 Alpha Beta Pruning 制作了一个 Tic Tac Toe 游戏。我想为 Tic Tac Toe (10x10) 游戏制作计算机 AI,但它的游戏树大小大得离谱。
我的代码是这样的,我只需要更改两个变量即可更改连续所需的棋盘大小 + 单元格数。例子:
boardSize = 3 // This is for 3x3 tic tac toe
boardSize = 4 // This is for 4x4 tic tac toe
boardSize = 10 // This is for 10x10 tic tac toe
和
winStreak = 3 // Need to make 3 cells in a row to win
winStreak = 4 // Need to make 4 cells in a row to win
我希望你明白了。
因此,我将制作 Tic Tac Toe 的计划从 10x10 更改为 3x3,并且效果很好。
然后我改变boardSize = 4并winStreak = 3制作它(4x4)井字游戏。
现在,我认为带有 Alpha Beta 修剪的 Minimax 足以解决 4x4,但很惊讶地看到,事实并非如此。
当我迈出第一步(人类)时,minimax 算法会搜索 5-10 分钟,然后浏览器选项卡就会崩溃。连第一步都做不到。
我怎样才能提高它的速度?人们甚至可以使用 Minimax + Alpha Beta Pruning 解决国际象棋问题,但是我的代码有什么问题?
我的完整代码大约有 200-300 行,所以我将只编写伪代码。
humanMakeMove();
Minimax(); // Bot calls Minimax function to make a move
function Minimax(board, player) {
if (checkResult() != 0) // 0 = Game is on
return checkResult(); // 1 = Win, 0.5 = Draw, -1 = Lose
availableMoves = getAvailableMoves();
for(i = 0; i < availableMoves.length;i++)
{
move = availableMoves[i];
removeMoveFromAvailableMovesArray(move);
if (player == "X")
score = Minimax(board, "O");
else
score = Minimax(board, "X");
board[i] = "-"; // "-" means empty space
if (depth of tree is on first level && score == 1)
return maxScore; //Alpha Beta Pruning is applied here, if we get score of 1, then we don't need to search more.
}
}
Run Code Online (Sandbox Code Playgroud)
我还可以应用哪些优化来使代码运行得更快?
小智 7
有多种方法可以提高程序的性能。
k并将其用作 minimax 中的第一个候选深度k + 1。此外,您不仅可以存储最佳走法,还可以存储整个最佳走法序列,这称为主要变化。因此,在您找到 depth 的主要变化后k,将其提供给对 depth 的 minimax 调用k + 1,它通常会产生很多好的 alpha-beta 截止值。Javascript标签,因此我假设您正在使用这种语言来实现算法。就性能而言,Javascript 不被认为是最好的语言。因此,如果您熟悉 C、C++ 或 Java 等语言,用其中一种语言重写程序可以显着提高性能。最后,你的词
人们甚至可以使用 Minimax + Alpha Beta 剪枝来解决国际象棋问题
严格来说不是真的,因为国际象棋还不是一个已解决的游戏。但是存在可以轻松击败人类棋手的国际象棋程序(使用极小极大与 alpha-beta 剪枝和许多其他更高级的技术)。因此,程序可以击败专家级选手和世界冠军的事实并不意味着它玩得很完美。