作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在为一个小游戏实现 minimax,我注意到一些我称之为“拖延”的事情。归结为一个非常简单的例子:
在夺旗游戏中,旗帜在玩家 A 上方一格,玩家 B 距离玩家 50 格。轮到 A,他可以向前搜索 6 步。我所看到的是所有可能的 Action 都有一个“赢”的值(value),因为 A 知道他可以在 B 之前到达旗帜,即使他没有立即捕获它。因此,如果 UP 是顺序中的最后一步,他将向左和向右走一会儿,直到 B 在攻击距离内,然后他必须最终拿到旗帜。
一开始这个行为看起来像个错误,但逐步解决后我说服自己每一步都真的是“赢”,但这个行为并不好。我可以通过使从现在起 4 次移动后捕获的旗帜比现在捕获的旗帜更有值(value)来影响评估,但我想知道极小极大搜索是否有我遗漏的方面?是否存在任何概念,即较早获得高分比稍后获得同样高分更令人满意?
最佳答案
minimax 搜索本身没有任何东西可以让我们更愿意早日获胜。由于所有终端位置都评估为相同的分数,因此该算法有效地随机选择了一步。使您的评估函数在调用它的树中较深的每个级别略微降低获胜分数,并且 minimax 将选择更快获胜。
关于minimax - 在 minimax 中寻址 "procrastination",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10787749/
我是一名优秀的程序员,十分优秀!