java - Tic Tac Toe negamax 实现。-6ren

java - Tic Tac Toe negamax 实现。

转载作者：行者123 更新时间：2023-11-30 08:12:15

24

4

我正在尝试为 tic-tac-toe 应用程序实现 negamax 搜索函数，但它不会返回最佳值，而是似乎半随机猜测。这是我的代码的相关部分:

public int negamax(Result result, Token token) {
    if (result == Result.WIN) {
        return 1;
    } else if (result == Result.DRAW) {
        return 0;
    }

    int best = -1;

    for (Coordinate move : Board.getAvailableMoves()) {
        Token other = token.getOther();
        Result r = Board.makeMove(move, other);
        int eval = -negamax(r, other);
        Board.unmakeMove(move);

        if (eval > best) {
            best = eval;
        }
    }

    return best;
}

public Coordinate getNegamaxMove(Token token) {
    int score = -1;
    Coordinate bestMove = null;

    for (Coordinate move : Board.getAvailableMoves()) {
        Result result = Board.makeMove(move, token);
        int newScore = negamax(result, token);
        Board.unmakeMove(move);

        if (newScore >= score) {
            score = newScore;
            bestMove = move;
        }
    }

    return bestMove;
}

需要注意的是，我不会将棋盘作为参数传递，而是传递移动的结果，可以是 WIN、DRAW、VALID 或 OCCUPIED(最后 2 个与当前讨论无关)这些都是不言自明的。 Coordinate 类仅保存移动的行值和列值。

非常感谢:)

最佳答案

我已经成功让它工作了，negamax 方法有两个问题。首先， token 应该在循环所有可用的移动之前更改，而不是在循环内部更改。其次，由于我在 getNegamaxMove 方法中检查最佳 Action ，因此在 negamax 方法中，我必须跟踪最差的 Action 而不是最好的 Action 。以下是工作实现，其中旧部分被注释掉以进行比较:

public int negamax(Result result, Token token) {
    if (result == Result.WIN) {
        return 1;
    } else if (result == Result.DRAW) {
        return 0;
    }

    int worst = 1;
    // int best = -1

    Token other = token.getOther();
    for (Coordinate move : Board.getAvailableMoves()) {
        // Token other = token.getOther();
        Result r = Board.makeMove(move, other);
        int eval = -negamax(r, other);
        Board.unmakeMove(move);

        // if (eval > best) {
        //     best = eval;
        // }

        if (eval < worst) {
            worst = eval;
        }
    }

    // return best
    return worst;
}

关于java - Tic Tac Toe negamax 实现。，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30202563/

24

4

0

文章推荐： java - 在哪里修补程序分析期间收集的信息

文章推荐： Java - 对象中的ArrayList

文章推荐： java - Spring Rest Web 服务输入验证

c++ - C++ 中的 Tic-Tac-Toe 帮助，如何制作循环以便 Tic Tac Toe 游戏每次都会重复棋盘
我是初学者，所以我的代码很乱。我还没有完整地评论这个游戏，所以如果你需要澄清一些变量，我可以给你。 (顺便说一句，这是一个要求制作井字游戏的c++项目) 我的主要问题是，我将如何重复我的棋盘(每次有人
tic-tac-toe - 使计算机永远不会在井字游戏中迷路
我正在为C的Tic Tac Toe代码编写一个简单的游戏。我已经完成了大部分代码，但是我希望AI永不丢失。我已经阅读了有关minimax算法的信息，但我不理解。如何使用此算法使计算机获胜或平局，但永
被调用函数中的 MATLAB tic/toc
在MATLAB中，我想对一个别人写的函数进行计时，他们的函数内部可能使用了tic/toc。我想要我自己的 tic/toc。但如果内部函数调用 tic，则外部计时器会重置。我怎样才能避免这种情况？我不
被调用函数中的 MATLAB tic/toc
在MATLAB中，我想对一个别人写的函数进行计时，他们的函数内部可能使用了tic/toc。我想要我自己的 tic/toc。但如果内部函数调用 tic，则外部计时器会重置。我怎样才能避免这种情况？我不
c++ - Tic Tac Toe中如何分出胜负以及如何不让双方都进入同一个位置？
我现在想用我的代码做两件事。1) 检查获胜者2) 不让双方玩家在同一个位置进入eg.如果player1已经在board[0][0]='X'处输入了value，player2再次进入board[0][0
MATLAB tic-toc 结果以分钟格式显示
我在我的 Matlab 项目中的很多地方都使用了 tic-toc 函数。输出时间可以是331.5264 或1234.754 秒等。我可以输出这种分钟格式吗？例如。 5 分 30.6 秒？谢谢! 最佳
c# - 日期时间变量 "tics"一小时
我的代码(或者更确切地说，其他人的代码)有一个奇怪的问题。我正在调试并试图弄清楚为什么我们的时间显示错误。无论如何，这是打印时间的代码:
javascript - Tic-Tac_Toe 计算机算法
我一直在开发一个简单的井字棋游戏，但遇到了一堵砖墙。虽然大多数游戏功能都已到位，但我缺少适当放置计算机图 block 所需的关键算法。我需要一种算法，可以搜索 3x3 的瓷砖网格，并在网格中搜索计
charts - Gnuplot x tic 标签重叠
我正在用这种格式从数据文件中绘制一个 gnuplot 图表: 01 value_1_1 value_2_1 02 value_1_1 value_2_1 ... 01 value_1_n value_
每个 tic 上的 Gnuplot 水平条
在 gnuplot 中，如何在 y 轴上的每个 tic 标记处在整个图形上绘制水平条？就像一种特定点在哪里的视觉指示器。 (抱歉，如果这很简单，但谷歌搜索无果而终) 最佳答案见 set grid命令
javascript - Tic Tac Toe 游戏结束后禁用按钮
感谢这里人们的帮助，我成功地禁用了点击 div 并在已经使用 $(".pos").addClass('already-played'); 选择它们时覆盖它们；以及 CSS 中的这个: .已经播放{
gnuplot - 如何获取自动生成的 gnuplot tic 之间的距离？
我正在使用 gnuplot 绘制大量绘图。由于每个图的数据范围(x 轴和 y 轴)都是可变的，因此我需要让 gnuplot 自动设置范围和控制。但是，我需要在绘图下方放置一个定义的网格，水平线各 1/
java - Tic Tac Toe 游戏重置太快
我有一个井字棋游戏，其中用户(x)玩CPU(o)。游戏开始时，CPU 将 (o) 放置在中心，并在用户之后移动到随机位置。游戏设置为循环，但一旦出现获胜者，它就会重置，并且不会显示“你赢/输的横幅”。
Gnuplot : xtics - place strings at tics
我是 gnuplot 新手，正在尝试为项目创建堆叠直方图。我遇到的问题是，我无法将 ticlabels 放在 x 轴上(即使可以，它们也没有以整齐的方式格式化)。我的gp文件如下: 这是我的数据文件的
javascript Tic tac toe 游戏等待用户输入
我试图在没有人工智能的情况下实现井字棋游戏。不知怎的，我的点击功能会自动触发。您能帮我理解为什么点击功能会自动触发吗？这是 HTML 代码片段。 Tic Tac Toe Gam
gnuplot - Gnuplot 中 tic 之间的间距
我一直在疯狂地寻找这个问题的答案。如何设置 gnuplot 上抽动之间的距离？目前我的情节中的抽搐被挤得太紧了。我希望它们更加分散。这是一个例子: 我有一个如下所示的图表: 100 ——
c - Tic-Tac-Toe:如何填充决策树？
我正在制作一个井字游戏程序。我计划将 minimax 与它一起使用。我制作了一棵树，其中包含所有可能的游戏序列的空间，并且我正在寻找一种方法来填充它。我目前有这种类型: typedef struct
java - 如何实现java tic tac toe游戏功能
我在完成这项学校作业时遇到了问题。我想实现一种方法，其中代码显示 //call method to check for Winner，在每轮后检查获胜者。我不确定该怎么做。我尝试过各种不同的方法。然
matlab - TIC TOC 或 Profiler
我正在编写一些计算时间很重要的代码。我使用 tic toc 函数和 profiler 来测量时间。它们之间有什么区别？对于我的一段代码，tic toc 函数说明例如时间是 3 秒，但是我的所有代码行
Java Tic Tac Toe 构造函数
我正在尝试遵循本教程: https://www.youtube.com/watch?v=Db3cC5iPrOM 2:59 我听不懂他在说什么。我不明白为什么他在构造函数(public static

首页

博学

6Ren·AI

商城

java - Tic Tac Toe negamax 实现。