- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在尝试使用 alpha beta 剪枝实现一个国际象棋游戏。以下几乎可以正常工作,但它会返回错误的 Action 。
例如,可能会发生以下情况。
白色(用户)移动,白色王位 - a1/黑色(计算机),黑色王位 - h1
白方将王从 a1 - a2 下,然后黑方还手 g2 - g1???
计算机似乎返回了错误节点(棋盘表示)的着法,就好像给定棋盘位置的最佳评估没有一直传播到树上。因此,在探索的一个模拟位置中,计算机“想象”它的国王移动到 g2,然后返回从这个位置开始的移动,没有意识到这个位置是一个模拟位置而不是实际棋盘的表示(根节点?)。
我如何更正代码以使计算机返回实际棋盘表示的移动而不是错误的模拟之一?
谢谢。
初始调用 alphaBeta(3, ChessEngine.invertBoard(ChessEngine.board), -10000, 10000, true);
private static int alphaBetaEvaluate = 0;
private static int alphaBetaSelectedSquare = 0;
private static int alphaBetaMoveToSquare = 0;
public static int alphaBeta(int depth, char[] board, int alpha, int beta, boolean maxPlayer) {
//create a copy of the board
char[] boardCopy = board.clone();
//if terminal state has not been met, keep searching
if (maxPlayer == true && depth > 0) {
//for all of the moves that max can make
for (int i = 0; i < board.length; i++) {
for (int move : ChessEngine.getValidMoves(i, boardCopy)) {
//make the move
boardCopy[move] = boardCopy[i];
boardCopy[i] = '.';
alphaBetaEvaluate = rating(board, boardCopy, i, move);
//store the best move to make
int temp = alphaBeta(--depth, ChessEngine.invertBoard(boardCopy), -10000, 10000, false);
if (temp > alpha) {
alphaBetaSelectedSquare = i;
alphaBetaMoveToSquare = move;
alpha = temp;
}
//reset the board for the next simulated move
boardCopy = board.clone();
if (beta <= alpha) {
break;
}
}
}
return alpha;
} else if (maxPlayer == false && depth > 0) {
//for all of the moves that min can make
for (int i = 0; i < board.length; i++) {
for (int move : ChessEngine.getValidMoves(i, boardCopy)) {
//make the move
boardCopy[move] = boardCopy[i];
boardCopy[i] = '.';
beta = Math.min(beta, alphaBeta(--depth, ChessEngine.invertBoard(boardCopy), -10000, 10000, true));
//reset the board for the next simulated move
boardCopy = board.clone();
if (beta <= alpha) {
break;
}
}
}
return beta;
}
return alphaBetaEvaluate;
}
最佳答案
毕竟我没有得到你的实现。首先你要做的是创建一棵树。决策树并向上传播决策。您希望最大化您的评价,并期望敌人会选择使您的评价最小化的举 Action 为返回。
因此,除非您知道您根据情况所做的评估是正确调整的,否则反转董事会对我来说听起来不太合理。
对我来说另一个严重的问题是,你总是用 -10k 和 10k 作为 alpha 和 beta 的边界来调用下一步的最小值/最大值。这样你的算法就不会从以前的 Action 中“学习”。
您需要再次检查算法(例如我使用的维基百科)并查看它们使用的 alpha 和 beta 被之前的评估修改过。这样,更高深度的计算可以首先停止,其次更好地评估最佳着法。
我不是这方面的专家。几十年前,当我编写我的实现时,我使用了一些不同的东西。
另一个想法是不要在同一个方法中使用 min 和 max,而是使用 min 和 max 方法。它使您更有可能发现其他缺陷。
也不要用二王来评价。那没有目标。两个国王是随机的,不能赢。一件事可能是两个骑士或四个女王等等。它不是那么随机,您可以看到皇后在周围跳舞而无法互相捕获。或者使用三个骑士对一个女王。
并尝试围绕其他部分为自己创建一些单元测试。只是为了确保零件独立正常工作。为什么要使用字符?为什么不使用枚举或对象。您可以为每个字段重复使用对象(它更像是各种数字)。
但无论如何这是风格而非算法正确性。
关于java - 国际象棋 alpha beta 返回棋盘的错误 Action ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28498284/
我正在尝试将我的数据拟合为 beta 二项式分布并估计 alpha 和 beta 形状参数。对于此分布,先验取自 beta 分布。 Python 没有适用于 beta-binomial 的函数,但它适
正在使用 Material-UI 的测试版对于具有大量内容的 React 网络应用程序的长期愿景,如果必须使用 beta 功能并且使用遵循 Google Material 设计指南的 UI 库是一个好
嗨!我正在尝试实现 alpha-beta 搜索,但我首先想了解其背后的所有逻辑,而不仅仅是使用某种伪代码来实现它。 我的理解是:一个白人玩家下了一步棋(我们称它为 move1)。第一步被保存为 alp
将应用程序升级到 watchOS 3 beta 2 后,我无法在 Apple Watch 上运行我的应用程序。 最佳答案 遇到了同样的问题。我使用模拟器构建并运行该应用程序以确保该应用程序正常,然后再
我遇到了一个很奇怪的问题。在应用程序启动时,我调用 API 来获取 token 。它在 iOS 12 之前运行良好。但是,在 iOS 13 beta 版本上,没有调用完成关闭并且应用程序不断积累内存并
我需要我的 beta 测试人员有 beta 应用程序让他们测试它,但同时他们必须让生产应用程序在生产中工作。 问题是,如果他们成为 beta 测试者,似乎只能从 Google Play 获得 beta
我需要我的 beta 测试人员有 beta 应用程序让他们测试它,但同时他们必须让生产应用程序在生产中工作。 问题是,如果他们成为 beta 测试者,似乎只能从 Google Play 获得 beta
我的 iPhone 6s 和第一代 Apple Watch 都注册了开发者测试版。 我从两台设备中删除了 beta 配置文件。 watch 现在在 OS 3.0 (14S326) 上,但在两个设备多次
我有一个应用程序,我的客户会在每个主要开发步骤中通过分布式临时*(邮寄 x.ipa + x.mobileprovision 文件)持续审查。 在 8 月 mobileprovisioning 配置文件
我正在使用 fabric 进行 Beta 测试。 我从 Crashlytics 收到了有关 Beta 版应用程序的通知。标题为“XXX v1.0.0(5)已准备好测试”。 我希望我能在安装页面上看到一
它不应该返回一个 DRAW 吗? def alphabeta(alpha, beta, player) best_score = -INFINITY if not self.h
我正在使用网格搜索来优化适合平衡数据集的随机森林的超参数,我正在为选择哪个模型评估指标而苦恼。考虑到这个问题的现实背景,假阴性比假阳性代价更高。我最初尝试优化召回率,但最终得到了非常多的误报。我的解决
我正在运行交叉验证算法来找到最适合每天变化的数据的多项式。我想找到一种在简单图中显示拟合的不麻烦的方法,而不必每次都手动编写整个回归公式和绘图的 beta 系数。对于回归公式,求解很简单,我使用 sp
我正在运行交叉验证算法来找到最适合每天变化的数据的多项式。我想找到一种在简单图中显示拟合的不麻烦的方法,而不必每次都手动编写整个回归公式和绘图的 beta 系数。对于回归公式,求解很简单,我使用 sp
我有最新的Xcode 11 beta 5,其中包括iOS 13 beta 5模拟器。今天,苹果发布了iOS 13 beta 6,但没有发布新的Xcode 11 beta。 我可以以某种方式下载/更新X
我正在研究来自 wiki.commonjs.org 的异步模块定义我想知道这段代码的含义是什么。 特别是,我的问题是: return beta.verb();和return require("beta
如果我的 Perl 代码有生产代码位置和“测试版”代码位置(例如,生产 Perl 代码在 /usr/code/scripts 中,BETA Perl 代码在 /usr/code/beta/script
虽然我了解 MiniMax 树和 alpha-beta 修剪概念,但我不明白为什么在许多(例如维基百科)有关 alpha-beta 修剪的资源中存在像 α >= β 这样的条件。具体来说,equals
我正在根据我大学项目的客户反馈对在线内容进行排名。为此,我将每个内容与先前的 alpha 和 beta 参数相关联,并根据我得到的反馈更新这些内容。 随着我模拟越来越多的试验,alpha 和 beta
从 Apple 网站下载并安装 Xcode 9 beta 2 后,它无法在 Sierra OS X 版本 10.12.5 上启动,并报告以下错误: Process: Xcode [4789] Path
我是一名优秀的程序员,十分优秀!