- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用机器学习制作一个国际象棋引擎,但在调试它时遇到了问题。我需要帮助找出我的程序出了什么问题,如果有任何帮助,我将不胜感激。
我进行了研究,并从多个成功的项目中借鉴了想法。这个想法是使用强化学习来教导神经网络区分强弱位置。
我收集了超过2000个Elo的300万个游戏,并用我自己的方法给它们贴上标签。在研究了数百场比赛后,我发现,可以有把握地假设,在任何比赛的最后 10 回合中,平衡不会改变,获胜方拥有强大的优势。所以我从最后 10 回合中选择了位置并制作了两个标签:一个表示白色获胜,零表示黑色。我没有包括任何平局位置。为了避免偏见,我为双方选择了偶数个标有胜利的位置,并为双方下一回合选择了偶数个位置。
每个位置I由一个长度为773个元素的向量表示。棋盘上每个方格上的每个棋子,以及易位权和下一回合,我都用 1 和 0 进行编码。我的顺序模型有一个包含 773 个神经元的输入层和一个包含一个神经元的输出层。我使用了三隐藏层深度 MLP,第 1、2 和 3 层分别具有 1546、500 和 50 个隐藏单元,每个层的 dropout 正则化值为 20%。隐藏层与非线性激活函数ReLU连接,而最终输出层具有sigmoid输出。我使用了二元交叉熵损失函数和带有所有默认参数的 Adam 算法,除了学习率,我将其设置为 0.0001。
我使用了 3% 的位置进行验证。在前 10 个 epoch 中,验证准确率逐渐从 90% 上升到 92%,仅落后训练准确率 1%。进一步的训练导致过度拟合,训练准确度上升,而验证准确度下降。
我在多个位置上手动测试了经过训练的模型,并得到了非常糟糕的结果。总体而言,如果哪一方有更多棋子或棋子靠近转换方 block ,则该模型可以预测哪一方获胜。它还给下一回合的一方带来了小优势(0.1)。但总体来说意义不大。在大多数情况下,它严重偏爱黑色(约 0.3)并且没有正确考虑设置。例如,它将起始位置标记为~0.0001,就好像黑方几乎有 100% 的获胜机会。有时,立场的不相关转变会导致评估的不可预测的变化。双方各有一张王和一张王后,通常被视为白棋败局(0.32),除非黑王在某个方格上,尽管这并没有真正改变棋盘上的平衡。
我做了什么来调试程序:
为了确保我没有犯任何错误,我分析了每个位置是如何记录的,一步一步。然后,在训练之前,我从最终的 numpy 数组中挑选了十几个位置,并将其转换回来,以便在常规棋盘上分析它们。
我使用了同一游戏中的不同数量的位置(1 和 6),以确保使用太多相似的位置不会导致快速过度拟合。顺便说一句,即使我的数据库中每场比赛的一个位置都会产生 300 万个数据集,根据一些研究论文,这应该足够了。
为了确保我使用的位置不会太简单,我对它们进行了分析。其中 130 万棋子有 36 分(马、象、车和后;兵不包括在计数中),140 万棋子有 19 分,只有 30 万棋子棋子较少。
最佳答案
您可以尝试的一些事情:
关于machine-learning - 我使用 MLP 制作国际象棋引擎的方法有什么问题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58567509/
我正在尝试开发一个简单的国际象棋引擎,但我一直在为它的性能而苦苦挣扎。我已经实现了带有alpha-beta修剪和迭代加深的Negamax(没有任何其他启发式方法),但是我无法获得超过3-4层的合理搜索
我目前正在开发国际象棋引擎,目前该引擎一直在工作,但要花很多时间才能产生移动。由于必须生成许多移动,因此检查检测花费的时间最长。 我尝试了很多事情后陷入困境,无法真正弄清楚如何提高效率。这是我的方法:
我正在尝试用 Java 为我的游戏板(国际象棋)建立初始状态。但是,当我运行该程序时,板似乎被翻转了?如果您查看初始状态方法,这就是我希望初始板启动的方式: public void initialBo
我正在尝试实现Knight-Distance中描述的绝对排名文件距离。来自Chess Programming Wiki ,但我对 ints a 和 b 应该在什么地方有点困惑 int knightDi
我一直在研究表格,以便可以使用 html 中的表格创建棋盘。这是我在网上找到的一些代码:HTML 代码: ♜ ♞ ♝ &
我有如下算法来防止玩家选择将其置于检查状态的移动: 假走(通过复制棋盘并在复制的棋盘上工作) 在走法被伪造之后,得到所有合法的对手走法。 如果合法走法之一可以攻击玩家的国王,则不能选择最初伪造的走法。
如果没有图片,这可能有点难以解释,但是,我正在检查国王是否在检查中。为此,我从国王的位置开始向上、向左、向下、向右,然后是所有对角线图案。 为了简化我的代码,我有一个路径检查器方法,它接受起始位置和结
我已经为我的国际象棋引擎实现了带有静态搜索的 alpha-beta 搜索。然而,在大多数情况下,静态搜索占用了总执行时间的 80-90%,正如我的分析器所显示的那样。我的修剪有问题吗? 我已经包含了
我正在编写一个简单的国际象棋游戏。我不会在这里全部发布,但我会为您提供必要的详细信息。 我通过点击一个上面有棋子的方 block 来移动,然后这个方 block 被选中,然后点击我想要棋子的地方移动。
嗨! 我正在尝试为我的国际象棋引擎编写一个 negamax 搜索算法,但我似乎无法让它工作。我以 wikipedias 伪代码为例,但不知何故它没有产生预期的结果。当我用 2 层运行它时,它改变了我的
我正在对国际象棋 AI 进行试验,目前正在尝试检测平局的可能性。 如果出现以下情况,玩家可以要求平局: 在每个玩家的最后 50 步棋中没有吃到或走棋。 相同的棋盘位置出现了 3 次。 因此,程序必须存
我正在用 Java 开发国际象棋程序并考虑以下问题: Rook 部分需要实现直线移动。 Bishop 部分需要实现沿对角线移动。 但是, Queen piece 需要实现上述两种运动模式。 我想不出一
我有一个问题。 我们有无限的棋盘,如何计算 n 次跳跃后你可能发现自己跳跃的一半的数量? 例如: 一次跳跃后我们有8个盒子 两次跳跃后我们有33个盒子 #include using namespace
这个问题已经有答案了: How do I generate all of a knight's moves? (10 个回答) 已关闭 9 年前。 我正在尝试根据当前位置获取骑士可以放置的所有可能位置
好吧,我先承认这个会有点长。我正在为 C# 编写国际象棋引擎,最终目标包括 UCI 实现。我已经做到了,给定一个棋盘,引擎将生成所有有效 Action 的列表;然而,我的评估代码似乎很挣扎,因为在与自
我正在实现一个国际象棋引擎,我已经编写了一个相当复杂的 alpha-beta 搜索例程,其中包含静态搜索和换位表。但是,我观察到一个奇怪的错误。 评估函数使用的是方 block 表,就像这个用于棋子的
我正在编写一个基本的 Java 国际象棋游戏并编写了以下类:Game、Player、Board、Square、Piece(每个特定棋子的父类(super class))和每个特定棋子类(例如 Pawn
我正在为类似于国际象棋的游戏编写 AI。棋盘为 10x10,每面 15 block 都有象棋相似的走法。 游戏中的一切都组织在对象中。瓷砖[][] 瓷砖; 10x10,每个 Tile 都有一个 pie
我正在制作游戏国际象棋,几乎得到了所有东西,但只有一件事:我需要制作它,这样玩家就不可能将棋子移动到检查中。我在解决这个问题时遇到了麻烦。 我现在用伪代码生成有效移动的是:getMoveLocatio
我正在尝试使用 alpha beta 剪枝实现一个国际象棋游戏。以下几乎可以正常工作,但它会返回错误的 Action 。 例如,可能会发生以下情况。 白色(用户)移动,白色王位 - a1/黑色(计算机
我是一名优秀的程序员,十分优秀!