java - 在 Minimax 期间我们实际上在哪里分配最佳移动？-6ren

java - 在 Minimax 期间我们实际上在哪里分配最佳移动？

转载作者：太空宇宙更新时间：2023-11-04 09:31:55

25

4

我对极小极大和 alpha beta 剪枝如何返回“最佳值”有很好的理解。但是我不确定“最佳 Action ”应该分配在哪里。

我知道最好的移动需要来自传入的原始棋盘，并且由于我正在寻找最大值，因此必须将其分配给最大化玩家。然而，使用我当前的代码会导致最佳操作被一遍又一遍地重新分配。
例如如果原来的棋盘是O--\n---\n---，那么最佳 Action 就变成
OX-\n---\n---，然后重新分配给 O-X\n---\n--- 等等。

public int minimax(Board board, int depth, boolean maximizing,int alpha,int beta) {
    int bestValue;
    if (board.isTerminal()) {
        bestValue = board.calculateValue();
    } else if (maximizing) {
        bestValue = alpha;
        for (Action action : board.makePossibleActions()) {
            int childValue = minimax(board.makeCopy().takeAction(action),depth+1,false,bestValue,beta);
            if (bestValue <= childValue) {
                bestValue = childValue;
                if (board.equals(originalBoard)) {
                    bestAction = action;
                }
            }
            bestValue = Math.max(bestValue,childValue);
            if (beta <= bestValue) {
                break;
            }
        }
    } else {
        bestValue = beta;
        for (Action action : board.makePossibleActions()) {
            int childValue = minimax(board.makeCopy().takeAction(action),depth+1,true,alpha,bestValue);
            bestValue = Math.min(bestValue,childValue);
            if (bestValue <= alpha) {
                break;
            }
        }
    }
    return bestValue;
}

最佳答案

你知道 root 是一名 max 玩家。
您还知道深度(0 或 1，具体取决于您如何进行初始调用)。

因此，如果要玩最大玩家，则您位于树的根部，并且更新最大移动的值，然后还将该移动存储在类变量中以返回。 (不要取最大值，而是测试该值是否更大，然后一起更新最大值和最佳移动。)

关于java - 在 Minimax 期间我们实际上在哪里分配最佳移动？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57015115/

25

4

0

文章推荐： python - 通过 datetime.date 列表选择数据帧行(datetimeindex)

文章推荐： html - HTML/CSS 是否支持自动缩放内容以匹配/填充容器？

minimax - 在 minimax 中寻址 "procrastination"
我正在为一个小游戏实现 minimax，我注意到一些我称之为“拖延”的事情。归结为一个非常简单的例子: 在夺旗游戏中，旗帜在玩家 A 上方一格，玩家 B 距离玩家 50 格。轮到 A，他可以向前搜索
javascript - miniMax 算法是否能够处理任何输入
我正在努力使用 miniMax 算法构建一个基本的 tictactoe 游戏，并且我在 JavaScript 中有一个可以运行的实现。然而，我正在向它提供一些测试板状态，但它似乎没有按我预期的方式工作
Java 类构造函数更改输入参数 - MiniMax
我正在为 Connect 4 编写 MiniMax 代码。基本上，我有一个 SimpleMiniMax 类，它有一个方法 minimax (接受 grid 的输入)，该方法应该返回类 Move 的实例
java - MiniMax 实现
我正在尝试用 Java 编写一个小型 AI 算法来实现 miniMax 算法。此游戏所基于的游戏是双人游戏，两名玩家每回合各走一步，每个棋盘位置都会导致每位玩家得分。玩家 X 位置的“质量”是通过从
java - Minimax 算法逻辑输出意想不到的结果
我正在为一个简单的国际象棋引擎制作一个极小极大算法，但是遇到了一些困难。我已经运行了我的代码几个小时但无济于事，它似乎仍然输出错误的结果；当我威胁它的一个棋子并且它有一个有效的移动可以挽救该棋子时，它
c++ - 不用递归实现 Minimax
我正在构建一个 Tic Tac Toe 解决机器人。为了练习，我使用 minimax 算法写了一个 Tic Tac Toe 游戏，效果很好。当我想将我的代码移植到 Controller 时，我发现这个
algorithm - Minimax 算法没有按预期工作
我目前正在使用 C# 开发针对 AI 的西洋跳棋游戏。我尝试使用 minimax 算法来实现 AI。尽管我的功能有效，但它选择的 Action 根本不符合逻辑。我用很多游戏和算法测试了它，当有很多更好
c++ - Minimax 算法中的线程
我正在设计一款 3D 井字棋游戏，发现时间限制了我的 Minimax 算法的深度。虽然深度达到 6 在很大程度上是无关紧要的时间 (Depth 7 = 6 seconds >Depth 8 = 49
algorithm - Minimax 算法未按预期工作
我正在使用 Realm of Racket 中给出的 stub 为滴答游戏构建 AI。书作为依据。到目前为止，一切进展顺利。但是，当我尝试运行我的 minimax 时树根上的函数，它返回一个列表，其中
c - Minimax 不能在井字游戏中正确计分分支
我正在尝试用 C 语言创建完美的井字游戏。我正在使用 2D 数组来跟踪棋盘。我已将问题缩小到我的 minimax 函数对每个潜在移动进行评分的方式，但我在调试它时遇到了麻烦，因为错误通常发生在第二步
python - Minimax 算法只返回特定的一组值
我在 Python 中为基本的井字棋 AI 实现了一个极小极大算法，如下所示: def minimax(currentBoard, player): if isGameOver(current
c++ - Minimax 算法究竟是如何工作的？
我正在研究 Minimax 算法来构建五子棋游戏。我对 Minimax 的问题是，在子节点中具有相同的评估值，这是真正添加到父节点或随机添加的。 Example tree from Wiki 所以从上
algorithm - minimax 静态树是如何构建的？
考虑到我正在从头开始构建井字游戏，我目前正在尝试使用 minimax 算法，这样我就可以让计算机作为玩家 1，而我自己作为玩家 2。我想我理解 minimax 算法(作为某种形式的深度第一次搜索)。
algorithm - Minimax:残局中分数相等怎么办？
据我所知，最简单形式的 Minimax 算法的工作方式如下:自下而上遍历游戏树，如果轮到玩家，则将所有子节点的最大分数分配给当前节点，否则最低分数。叶子根据游戏输出进行评分，比方说赢+1，平0，输-1
java - MiniMax 返回反向效用值
我正在尝试打印出 Mini Max 的访问状态和效用。当值从终端状态返回到其根时，我遇到了问题，从而导致我访问的状态实用程序值中的 4 个不正确。我只是不知道是什么原因导致了这个错误。我很确定我的 M
java - Minimax 算法不返回最佳移动
我正在使用带 alpha-beta 剪枝的极小极大算法编写黑白棋引擎。它工作正常，但我发现了以下问题: 当算法发现位置丢失时，它会按预期返回 -INFINITY，但在在这种情况下，我无法追踪“最佳”走
c++ - 一个简单的国际象棋 Minimax
我自己的国际象棋引擎使用 minimax 算法搜索国际象棋走法有问题我使用 5 层深度搜索并且只有 Material /奖励/移动性评估，但即使我给出它也会做出愚蠢的移动并牺牲有值(value)的棋子
点和框游戏的 Java minimax
我正在尝试实现一个使用 Minimax 进行点和框游戏的 AI (http://en.wikipedia.org/wiki/Dots_and_Boxes) 这是我目前所拥有的: public
ruby - 在井字游戏中调试递归 MiniMax
我正在尝试让 minmax 算法(计算机 AI)在我的井字游戏中发挥作用。我已经坚持了好几天了。从本质上讲，我不明白为什么计算机 AI 只是简单地将它的标记 ("O") 从棋盘 block 0-8 中
f# - 尝试使用连续传递样式来避免使用 minimax 算法的堆栈溢出
我的目标摘要:弄清楚在使用我认为不能进行尾递归的算法时，如何使用连续传递样式来避免堆栈溢出。或者，找到一种方法使函数尾递归。详情: 我是 F# 的新手(以及一般的函数式编程)，我正在尝试使用 alp

首页

博学

6Ren·AI

商城

java - 在 Minimax 期间我们实际上在哪里分配最佳移动？