algorithm - Minimax 算法没有按预期工作-6ren

algorithm - Minimax 算法没有按预期工作

转载作者：塔克拉玛干更新时间：2023-11-03 06:40:41

我目前正在使用 C# 开发针对 AI 的西洋跳棋游戏。我尝试使用 minimax 算法来实现 AI。尽管我的功能有效，但它选择的 Action 根本不符合逻辑。我用很多游戏和算法测试了它，当有很多更好的选择时，它只会选择不好的 Action 。我不认为这是由于地平线问题，因为它的移动会产生直接后果，例如在没有捕获任何对手棋子的情况下丢失棋子。关于代码的 Som 注释:

我的函数采用一个 8x8 二维枚举 Pieces 数组，代表棋盘。
BlackPlayer 是一个 bool 值，属于同一个类中的函数。
MyPiece(currentPiece) 函数检查 currentPiece 是否与 AI 颜色相同。
由于捕获在西洋跳棋中是强制性的，因此函数首先检查 gameState 是否包含任何捕获 Action 。如果不是检查正常移动。
我使用 alpha-beta 修剪来提高效率。

我使用 CloneGameState(gameState) 函数复制二维数组，这样代表游戏的原始数组就不会改变。

public int Minimax (Pieces[,] gameState, int depth, bool is_maximizing, int alpha, int beta)
{
    //Base Case - Return the board value 
    if (depth == 3)
        return HeuristicEvaluation(gameState);

    Move[] possibleMoves;
    int bestValue;
    bool currentSide;

    if (is_maximizing)
    {
        bestValue = int.MinValue;
        currentSide = BlackPlayer;
    }
    else
    {
        bestValue = int.MaxValue;
        currentSide = !BlackPlayer;
    }

    // check forced moves
    int moveCount = rules.GetCaptureMoves(gameState,out possibleMoves, currentSide);
    // if no forced moves get normal moves 
    if (moveCount < 1)
        moveCount = rules.GetNormalMoves(gameState,out possibleMoves, currentSide);

    // traverse moves
    for (int i = 0; i < moveCount; i++)
    {
        Pieces[,] newGameState = ApplyMove(CloneGameState(gameState), possibleMoves[i]);
        int newStateValue = Minimax(newGameState, depth + 1, !is_maximizing,alpha, beta);

        if (is_maximizing)
        {
            if (newStateValue > bestValue)
            {
                bestValue = newStateValue;
                if (depth == 0)
                    bestMove = possibleMoves[i];
                if (newStateValue > alpha)
                    alpha = newStateValue;
                if (alpha >= beta)
                    return bestValue;
            }
        }
        //Evaluation for min
        else
        {
            if (newStateValue < bestValue)
            {
                bestValue = newStateValue;
                if (newStateValue < beta)
                    beta = newStateValue;
                if (alpha >= beta)
                    return bestValue;
            }
        }
    }
    return bestValue;
}

启发式函数:

public int HeuristicEvaluation(Pieces[,] gameState)
{
    int stateValue = 0;

    //use loops to check each piece 
    for (int j = 0; j < 8; j++)
    {
        int i = 0;
        if (j % 2 == 1)
            i++;

        for (; i < 8; i += 2)
        {
            Pieces currentPiece = gameState[i, j];

            if (currentPiece != Pieces.empty)
            {

                // if the current piece is mine
                if (MyPiece(currentPiece))
                {
                    // check if my piece is a king
                    if (currentPiece == Pieces.whiteKing || currentPiece == Pieces.blackKing)
                        stateValue += 80;
                    // my piece is a man
                    else
                    {
                        stateValue += 30;
                        // row values, closer to king zone higher the value 
                        if (currentPiece == Pieces.blackMan)
                        {
                            // black goes in reverse direction
                             int y = 7-j;
                             stateValue += y;
                        }
                        else
                             stateValue += j; 
                    }
                    // pieces on the edge are safe from capture
                    if (i == 0 ||i == 7 || j== 0 ||j ==7)
                    {
                        stateValue += 10;
                    }

                }

                // point reduction for enemy pieces
                else
                {
                    if (currentPiece == Pieces.whiteKing || currentPiece == Pieces.blackKing)
                        stateValue -= 80;
                    else
                    {
                        stateValue -= 20;

                        // row values, closer to king zone higher the value 
                        if (currentPiece == Pieces.blackMan )
                        {
                            // black goes in reverse direction
                            int y = 7-j;
                            stateValue -= y;
                        }
                        else
                            stateValue -= j;
                    }
                    // pieces on the edge cant be captured
                    if (i == 0 || i == 7 || j == 0 || j == 7)
                    {
                        stateValue -= 10;
                    }
                }
            }
        }
    }
    return stateValue;
}

最佳答案

首先，我想指出您的函数 Maximizer 和 Minimizer 可以合并到一个函数 Minimax(Pieces, gameState, depth, bool is_maximizing) 中，因为它们的逻辑几乎相同，除了一对的代码行。因此，您将调用 Minimax 并将 is_maximizing 设置为 true，而不是调用 Maximizer。而不是调用 Minimizer，只需调用 Minimax 并将 is_maximizing 设置为 false。这将有助于避免重复，并使您的代码更具可读性。

第一点导致我们在算法中犯了一个错误。在 Minimize 函数中递归调用自身，而您应该调用 Maximize 函数。

另一点是您在给定位置处理所有有效移动的方式。您不必将捕获 Action 的处理与非捕获 Action 分开。原因再次是处理两种类型移动的逻辑是相同的。我建议创建两个函数 - GenerateValidMoves() 和 SortValidMoves()。 GenerateValidMoves() 函数将生成给定位置中所有有效移动的列表。生成移动列表后，调用 SortValidMoves() 对列表进行排序，以便捕获移动位于列表的开头，然后是非捕获移动。

这是极小极大的简化伪代码:

Minimax(color, board, depth, is_max):
    if ((depth == DEPTH_CUTOFF) or IsTerminalNode()):
        return EvalBoard()
    best_score = is_max ? -infinity : infinity
    valid_moves = GenerateValidMoves(board, color)
    for curr_move in valid_moves:
        clone_board = board.clone()
        clone_board.make_move(curr_move)
        int curr_score = Minimax(opposite_color, clone_board, depth + 1, !is_max)
        if (is_max) {
            if (curr_score > best_score) {
                best_score = curr_score
                best_move = curr_move
            }
        } else {
            if (curr_score < best_score) {
                best_score = curr_score
                best_move = curr_move
            }
        }
    return best_score

关于algorithm - Minimax 算法没有按预期工作，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51380266/

文章推荐： c++ - 霍尔分区不起作用？

文章推荐： java - 从座位预订系统中获取连续 3 个值？

文章推荐： java - n-body Simulation 预期性能 barnes hut

minimax - 在 minimax 中寻址 "procrastination"
我正在为一个小游戏实现 minimax，我注意到一些我称之为“拖延”的事情。归结为一个非常简单的例子: 在夺旗游戏中，旗帜在玩家 A 上方一格，玩家 B 距离玩家 50 格。轮到 A，他可以向前搜索
javascript - miniMax 算法是否能够处理任何输入
我正在努力使用 miniMax 算法构建一个基本的 tictactoe 游戏，并且我在 JavaScript 中有一个可以运行的实现。然而，我正在向它提供一些测试板状态，但它似乎没有按我预期的方式工作
Java 类构造函数更改输入参数 - MiniMax
我正在为 Connect 4 编写 MiniMax 代码。基本上，我有一个 SimpleMiniMax 类，它有一个方法 minimax (接受 grid 的输入)，该方法应该返回类 Move 的实例
java - MiniMax 实现
我正在尝试用 Java 编写一个小型 AI 算法来实现 miniMax 算法。此游戏所基于的游戏是双人游戏，两名玩家每回合各走一步，每个棋盘位置都会导致每位玩家得分。玩家 X 位置的“质量”是通过从
java - Minimax 算法逻辑输出意想不到的结果
我正在为一个简单的国际象棋引擎制作一个极小极大算法，但是遇到了一些困难。我已经运行了我的代码几个小时但无济于事，它似乎仍然输出错误的结果；当我威胁它的一个棋子并且它有一个有效的移动可以挽救该棋子时，它
c++ - 不用递归实现 Minimax
我正在构建一个 Tic Tac Toe 解决机器人。为了练习，我使用 minimax 算法写了一个 Tic Tac Toe 游戏，效果很好。当我想将我的代码移植到 Controller 时，我发现这个
algorithm - Minimax 算法没有按预期工作
我目前正在使用 C# 开发针对 AI 的西洋跳棋游戏。我尝试使用 minimax 算法来实现 AI。尽管我的功能有效，但它选择的 Action 根本不符合逻辑。我用很多游戏和算法测试了它，当有很多更好
c++ - Minimax 算法中的线程
我正在设计一款 3D 井字棋游戏，发现时间限制了我的 Minimax 算法的深度。虽然深度达到 6 在很大程度上是无关紧要的时间 (Depth 7 = 6 seconds >Depth 8 = 49
algorithm - Minimax 算法未按预期工作
我正在使用 Realm of Racket 中给出的 stub 为滴答游戏构建 AI。书作为依据。到目前为止，一切进展顺利。但是，当我尝试运行我的 minimax 时树根上的函数，它返回一个列表，其中
c - Minimax 不能在井字游戏中正确计分分支
我正在尝试用 C 语言创建完美的井字游戏。我正在使用 2D 数组来跟踪棋盘。我已将问题缩小到我的 minimax 函数对每个潜在移动进行评分的方式，但我在调试它时遇到了麻烦，因为错误通常发生在第二步
python - Minimax 算法只返回特定的一组值
我在 Python 中为基本的井字棋 AI 实现了一个极小极大算法，如下所示: def minimax(currentBoard, player): if isGameOver(current
c++ - Minimax 算法究竟是如何工作的？
我正在研究 Minimax 算法来构建五子棋游戏。我对 Minimax 的问题是，在子节点中具有相同的评估值，这是真正添加到父节点或随机添加的。 Example tree from Wiki 所以从上
algorithm - minimax 静态树是如何构建的？
考虑到我正在从头开始构建井字游戏，我目前正在尝试使用 minimax 算法，这样我就可以让计算机作为玩家 1，而我自己作为玩家 2。我想我理解 minimax 算法(作为某种形式的深度第一次搜索)。
algorithm - Minimax:残局中分数相等怎么办？
据我所知，最简单形式的 Minimax 算法的工作方式如下:自下而上遍历游戏树，如果轮到玩家，则将所有子节点的最大分数分配给当前节点，否则最低分数。叶子根据游戏输出进行评分，比方说赢+1，平0，输-1
java - MiniMax 返回反向效用值
我正在尝试打印出 Mini Max 的访问状态和效用。当值从终端状态返回到其根时，我遇到了问题，从而导致我访问的状态实用程序值中的 4 个不正确。我只是不知道是什么原因导致了这个错误。我很确定我的 M
java - Minimax 算法不返回最佳移动
我正在使用带 alpha-beta 剪枝的极小极大算法编写黑白棋引擎。它工作正常，但我发现了以下问题: 当算法发现位置丢失时，它会按预期返回 -INFINITY，但在在这种情况下，我无法追踪“最佳”走
c++ - 一个简单的国际象棋 Minimax
我自己的国际象棋引擎使用 minimax 算法搜索国际象棋走法有问题我使用 5 层深度搜索并且只有 Material /奖励/移动性评估，但即使我给出它也会做出愚蠢的移动并牺牲有值(value)的棋子
点和框游戏的 Java minimax
我正在尝试实现一个使用 Minimax 进行点和框游戏的 AI (http://en.wikipedia.org/wiki/Dots_and_Boxes) 这是我目前所拥有的: public
ruby - 在井字游戏中调试递归 MiniMax
我正在尝试让 minmax 算法(计算机 AI)在我的井字游戏中发挥作用。我已经坚持了好几天了。从本质上讲，我不明白为什么计算机 AI 只是简单地将它的标记 ("O") 从棋盘 block 0-8 中
f# - 尝试使用连续传递样式来避免使用 minimax 算法的堆栈溢出
我的目标摘要:弄清楚在使用我认为不能进行尾递归的算法时，如何使用连续传递样式来避免堆栈溢出。或者，找到一种方法使函数尾递归。详情: 我是 F# 的新手(以及一般的函数式编程)，我正在尝试使用 alp

塔克拉玛干

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

algorithm - Minimax 算法没有按预期工作