java - 为什么 Alpha/Beta 剪枝对我的 MiniMax 算法没有影响？-6ren

java - 为什么 Alpha/Beta 剪枝对我的 MiniMax 算法没有影响？

转载作者：塔克拉玛干更新时间：2023-11-03 05:17:12

25

4

首先，我很抱歉标题有点不正确，我只是不想让它有 30 个字那么长。当我将它应用到我的 TicTacToe 游戏时，我实现的 alpha/beta 修剪极大地减少了评估的数量，请参见下面的内容。

每对评估计数均使用与输入相同的游戏状态进行测量。

当我想对我一直在研究的玩神经网络的西洋跳棋实现修剪时，问题就出现了。这就是整个事情的目标，我刚刚制作了 TicTacToe 游戏来试验 MiniMax + Alpha/Beta，因为我以前从未处理过这些算法。

这是使用神经网络进行的同类实验。

现在是代码(西洋跳棋，如果您想看一下 TicTacToe 版本，请告诉我，尽管它们几乎相同)。

我将只粘贴一次这两种方法的开头，因为它们完全相同，我将显示两个签名，因为它们略有不同。

Small note to make the code more clear.

Board is the object which keeps track of pieces, available moves, which turn it is, if the game has been won/drawn etc...

Move is the object which contains all information pertinent to moves, when I make the clone as the first line of the method I simply make a clone of the given board and the constructor applies the given move to it.

private double miniMax(Board b, Move m, int depth) {

和

private double alphaBeta(Board b, Move m, int depth, double alpha, double beta) {

两种方法的开始:

Testboard clone = new Testboard(b, m);
    // Making a clone of the board in order to
    // avoid making changes to the original one

    if (clone.isGameOver()) {

        if (clone.getLoser() == null) 
            // It's a draw, evaluation = 0
            return 0;   

        if (clone.getLoser() == Color.BLACK)
            // White (Max) won, evaluation = 1
            return 1;

        // Black (Min) won, evaluation = -1
        return -1;  
    } 

    if (depth == 0) 
        // Reached the end of the search, returning current Evaluation of the board
        return getEvaluation(clone);

常规 MiniMax 延续:

    // If it's not game over
    if (clone.getTurn() == Color.WHITE) {

        // It's white's turn (Maxing player)
        double max = -1;
        for (Move move : clone.getMoves()) {
            // For each children node (available moves)
            // Their minimax value is calculated
            double score = miniMax(clone, move, depth-1);
            // Only the highest score is stored
            if (score > max)
                max = score;
        }
        // And is returned
        return max;
    } 

    // It's black's turn (Min player)
    double min = 1;
    for (Move move : clone.getMoves()) {
        // For each children node (available moves)
        // Their minimax value is calculated
        double score = miniMax(clone, move, depth-1);
        // Only the lowest score is stored
        if (score < min)
            min = score;
    }
    // And is returned
    return min;
}

带有 Alpha/Beta 剪枝延续的 MiniMax:

    // If it's not game over
    if (clone.getTurn() == Color.WHITE) {

        // It's white's turn (Maxing player)
        for (Move move : clone.getMoves()) {

            // For each children node (available moves)
            // Their minimax value is calculated                
            double score = alphaBeta(clone, move, depth-1, alpha, beta);

            if (score > alpha)
                // If this score is greater than alpha
                // It is assigned to alpha as the new highest score
                alpha = score;
            if (alpha >= beta)
                // The cycle is interrupted early if the value of alpha equals or is greater than beta
                break;
        }
        // The alpha value is returned
        return alpha;
    } 

    // It's black's turn (Min player)
    for (Move move : clone.getMoves()) {

        // For each children node (available moves)
        // Their minimax value is calculated            
        double score = alphaBeta(clone, move, depth-1, alpha, beta);

        if (score < beta)
            // If this score is lower than beta
            // It is assigned to beta as the new lowest score
            beta = score;
        if (alpha >= beta)
            // The cycle is interrupted early if the value of alpha equals or is greater than beta
            break;
    }
    // The beta value is returned
    return beta;
}

老实说，我被困住了，我不确定我该怎么做才能弄清楚发生了什么。我已经在几个不同甚至随机生成的神经网络上尝试过 MiniMax+A/B，但在评估次数方面我从未见过任何改进。我希望这里的人能够对这种情况有所了解，谢谢!

最佳答案

感谢@maraca 帮我解决了这个问题，因为他只回复了一条评论，所以要回答我自己。

我发布的代码没有任何问题，问题出在搜索达到深度限制后我使用的评估函数。

我使用的是一个仍然未经训练的神经网络，它本质上只是吐出随机值，这迫使 MiniMax+A/B 遍历所有节点，因为与答案不一致，结果证明这是必要的修剪发生。

关于java - 为什么 Alpha/Beta 剪枝对我的 MiniMax 算法没有影响？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42988523/

25

4

0

文章推荐： java - 为什么现在()？ (客观化)

文章推荐： algorithm - 哪种算法最适合根据一组标准连接用户？

文章推荐： java - 在 java 中使用 ArrayList 时的深拷贝

SSL 重新协商失败 - 影响？
这是一个非常笼统的问题，我希望我能答对。我正在研究 SSL/TLS 重新协商并已阅读了一些内容。这是我从阅读中了解到的内容: 从 SSL/TLS 重新协商的角度来看，客户端分为两个主要组，打补丁的和
android标题受其他标题(ToolBar)影响
第一个屏幕是艺术的细节。当我向上滚动时，标题将是 alpha。我点击另一个“艺术”到另一个细节 UI，然后按回到 Previous UI。之前的UI标题是黑色的，怎么变透明了。布局:
Cassandra 物化 View 影响
想知道 mv 对基表的影响。它会减慢基表的速度吗？它什么时候开始写入 mv，就像同时写入基表和 mv 一样？如果我有 local_quorum 的 CL 且 RF=3，客户端是否必须等到写入 mv
javascript - 影响 JavaScript for 循环中的对象
似乎在任何地方都找不到太多关于此问题的帮助，所以我想我会在这里尝试。我正在尝试制作一个简单的 for 循环，当我将鼠标悬停在 html 卡上时，它会隐藏卡中的一些文本。该卡有一个简单的名字和姓氏，我
java - 如何让时间不受 FPS 影响？
我有一个程序每帧运行 tick() 方法。我希望一个对象根据设定的重力常数下落，因此我创建了一个 Ball 对象，该对象会将其位置更新为前一帧的位置减去 y 速度。每个刻度 y 速度都会减少重力常数。
java - showMessageDialog 影响 KeyHandler
我的 KeyHandler 在这里: private void KeyHandler(java.awt.event.KeyEvent evt) {
java - 影响 for 循环的出队方法 (Java)
我有一个方法，其中使用了很多其他类，包括链接列表、队列和堆栈。在我的方法中，我有一个 for 循环，我想在其中弹出堆栈(方便地命名为 s)并将队列(方便地命名为 q)出队到 s1 和 q1。由于某种原
java - JTree 影响 JLabel
我有一个 JTree 节点数组和另一个自定义对象的相应数组。我想要什么:当选择 JTree 的节点时，相应对象(其数组中索引与节点数组中所选节点索引相同的对象)的字段填充 JLabels。我被困在
javascript - 影响 Javascript 性能的因素
我知道浏览器完成了处理客户端脚本(Javascript、JQuery 等)的所有工作，但想知道在性能方面是否还有其他重要因素(网络速度、客户端计算机速度、服务器环境) 如果它完全依赖于浏览器(类型和版
java - SocketServer.Accept() 影响？
我有一个 Android 服务在后台运行，它将使用以下代码: while(true) { ServerSocket server = new ServerSocket(1234); Socke
javascript - 重复 ID 影响
对JQM有以下疑惑: 1.如果我们在单独的 html 文件中使用重复的 id，对 jquery mobile 有什么影响。假设我们在单独的 html 文件中有重复的 id，但如果我们不使用该 id
mysql - 影响 MySQL 中带有关键字的所有行的产品变体
我正在尝试更新两个(inventory、sold)MySQL 表的表库存。假设我们正在处理的 sku 是 BT888-16 UPDATE inventory JOIN sold ON invento
java - 影响 JTable 单元格值在文本文件上的更改
我使用这种方法来更改我的表格单元格值，它在 jtable 上改变但在文本文件上没有改变! public class user_AllBooks extends AbstractTableModel
mysql - 影响 2 个服务器的存储过程
我想在向表中插入数据时创建一个 MYSQL 存储过程，数据也会被插入到其他服务器表中。我知道这在 ORACLE 数据库中是可能的，但我不知道它是否适用于 MYSQL。有什么办法吗？最佳答案是的
html - 影响 CSS 样式的表单标签
我在 css 方面非常糟糕，只能靠 SO 答案来解决 - 但是我找不到针对这个特定问题的任何解释。我有一个表单，其中包含一个 textarea 和一个 button(input/submit)，仅此
javascript - 影响 sibling 位置的动画
我在一个元素上有动画，但它的移动也会影响 sibling 。如何在不影响兄弟元素的情况下仅在元素上使用动画？问题示例: function animateSearch() { $('.glyph
ios - 影响 UIView 阴影的约束？
我试图在我的 ViewController 中的 UIView 的所有四个边上建立一个阴影 — 在我通过 Xcode 向 UIView 添加约束之前，它工作得很好。我怎样才能使 UIView 的阴影显
javascript 和 DHTML 影响
自从我使用 JavaScript 以来已经有一段时间了 - 在获得证书之后我开始学习 Perl 并从那时起就一直使用它。我只是想重新开始使用 JS，我已经写了这个，我想说的是，这是一个简单的小脚本，可
html - 影响 :active 上的多个类
我正在处理一个 HTML 元素，我添加了一个复选框，选中后会高亮显示所有文本输入字段。唯一的问题是一些输入字段在表格内，出于某种原因我无法用我的代码影响它们。任何帮助将不胜感激。相关代码: HTML
swift - 改变字符串扩展导致巨大的 CPU 影响
我为 String 类创建了一个小扩展，以便方便地从中删除字符。这是它的样子: mutating func drop(characters chars: [String]) { for c i

首页

博学

6Ren·AI

商城

java - 为什么 Alpha/Beta 剪枝对我的 MiniMax 算法没有影响？