gpt4 book ai didi

击败机器人的算法可预测地走向奖品

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:47:15 25 4
gpt4 key购买 nike

对于这个游戏,有一个 10x10 的棋盘和一些值(value)从 1 到 9 的不同奖品,有几个简单的机器人在玩,一个总是追求最接近的奖品,另一个总是追求最大的奖品分配给它的点数。机器人和奖品随机放置在棋盘上。任务是创建另一个简单的 AI,它总是收集最高的总分并赢得比赛。

我将如何在奖励点数和奖励距离之间进行选择,以使这个新的 AI 始终赢得比赛?我在想我会喜欢更接近的奖品,但如果奖品比最接近的奖品大 2 倍,我会选择更大的奖品,但这并不总能获胜。

机器人不知道机器人在哪里,如果一个机器人为一个奖品移动 8 个空间,另一个机器人可以在这段时间内移动 8 个空间并收集多个奖品。所有机器人同时移动并且可以沿对角线移动。一旦棋盘上没有奖品,游戏就结束。

最佳答案

无法保证获胜。如果机器人/奖品是随机放置的,那么肯定会有随机放置,这会使您在其他机器人获得奖品之前离奖品太远。

由于您知道其他机器人的确切行为,因此您可以模拟它们在给定棋盘上的所有 future Action 。然后,您可以将所有可能的移 Action 为一棵树和棋盘状态进行枚举,然后查看叶子并找到给您带来胜利分数的那个。换句话说,每个分支都是你做的一步,节点代表棋盘状态,包括其他机器人将做的步。此外,这不会是一棵二叉树,每个节点都会根据您在该回合移动的方向进行分支。在进行单个实际移动之前,您将完全构建这棵树,因此一旦您选择了最佳路径,基本上就可以预测游戏的结果。这是可能的,因为其他机器人以可预测的方式移动。

此外,在您移动时,您可以添加检查以确保其他机器人按照您的预测移动,这就像一个调试功能。根据系统的运作方式,他们可能会在决定自己的 Action 之前看到你的 Action ,这取决于每个人是同时移动,还是一次一个移动。无论哪种方式都可以做到,您只需确保您的模型如何移动是准确的。

请注意,可能还有其他叶子,您的分数更高但输了,因为其他机器人中的一个主导了另一个。 IE。 (you:12, a:1, b:17) vs. (you:11, a:10, b:9)

可能最成功的路径是那些利用其他机器人行为的路径,例如,当它离你更近时捕获最高奖品,导致贪婪的机器人松动走向它。如果您有足够的 Action ,还可以在途中转移奖品。不过,您不必为此行为编写代码,因为当您创建树并找到最佳移动系列时,它会隐式发生。

关于击败机器人的算法可预测地走向奖品,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16472102/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com