- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我必须为android实现一个reversi游戏。我已经实现了所有的游戏,是功能性的,但问题是我没有一个人工智能。事实上,每移动一步,电脑都会移动到能使他获得最多碎片的位置。
我决定实现和α-β修剪算法。我在网上做了很多关于它的研究,但是我不能得出一个最终的结论怎么做。我试着实现了一些功能,但是没有达到预期的效果。
我的电路板存储在类电路板中(在这个类中,每个播放器占用的部分存储在一个二维int数组中)。我附上了一张小图表(很抱歉它看起来很像)。
图表:https://docs.google.com/file/d/0Bzv8B0L32Z8lSUhKNjdXaWsza0E/edit
我需要帮助来找出如何在我的实现中使用minimax算法。
到目前为止,我的理解是,我必须对董事会的价值作出评估。
为了计算董事会的价值,我必须考虑以下因素:
-自由角(我的问题是,我只需要关心自由角,还是我可以在当前的移动?!左右为难)。
-棋盘移动:检查当前移动后可移动的棋子数量。
-板的稳定性…我知道这意味着板上不能翻转的碎片的数量。
-搬家给我提供的数量
我计划实现一个新的类board a i,它将把board对象和dept作为一个参数。
你能告诉我如何实现这个人工智能的逻辑流程吗?
在dept中计算时,我需要一些关于递归的帮助,我不理解它如何计算最佳选择。
谢谢您!
最佳答案
首先,你可以检查this piece of code我多年前写的跳棋a i。有趣的是最后一个函数(alphabeta
)。(这是用python编写的,但我认为您可以将其视为伪代码)。
显然我不能教你所有的alpha/beta理论,因为它可能有点棘手,但也许我可以给你一些实用的建议。
评价函数
这是一个好的min/max alpha/beta算法的关键点之一(以及任何其他有信息的搜索算法)。写一个好的启发式函数是人工智能发展的艺术部分。你必须很好地了解这个游戏,与专业的游戏玩家交谈,了解哪些棋盘功能是重要的,回答这个问题:这个位置对玩家X有多好?
您已经指出了一些好的特性,如机动性、稳定性和自由角。但是请注意,求值函数必须是快速的,因为它将被多次调用。
基本的评估函数是
H = f1 * w1 + f2 * w2 + ... + fn * wn
f
是一个特征得分(例如自由角的数量),
w
是一个相应的权重,表示特征f在总分中的重要性。
self.board.all_move(player)
完成的。它返回一个移动列表。
for mov in moves :
self.board.apply_action(mov)
v = max(v, self.alphabeta(alpha, beta, level - 1, self._switch_player(player), weights))
self.board.undo_last()
n
级别之后停止迭代。例如,我从b1,
max_level=2
和
current_level=max_level
开始。
if level == 0 :
value = self.board.board_score(weights)
return value
关于java - 适用于Android黑白棋游戏的Minimax/Alpha Beta,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14365097/
我在我的 Xcode 项目目录中输入了以下内容: keytool -genkey -v -keystore release.keystore -alias mykey -keyalg RSA \
假设我有一个像这样的 DataFrame(或 Series): Value 0 0.5 1 0.8 2 -0.2 3 None 4 None 5 None
我正在对一个 Pandas 系列进行相对繁重的应用。有什么方法可以返回一些打印反馈,说明每次调用函数时在函数内部进行打印还有多远? 最佳答案 您可以使用跟踪器包装您的函数。以下两个示例,一个基于完成的
我有一个 DataFrame,其中一列包含列表作为单元格内容,如下所示: import pandas as pd df = pd.DataFrame({ 'col_lists': [[1, 2
我想使用 Pandas df.apply 但仅限于某些行 作为一个例子,我想做这样的事情,但我的实际问题有点复杂: import pandas as pd import math z = pd.Dat
我有以下 Pandas 数据框 id dist ds 0 0 0 0 5 1 0 0 7 2 0 0
这发生在我尝试使用 Gradle 构建时。由于字符串是对象,因此似乎没有理由发生此错误: No signature of method: java.util.HashMap.getOrDefault(
您好,有人可以解释为什么在 remaining() 函数中的 Backbone 示例应用程序 ( http://backbonejs.org/examples/todos/index.html ) 中
我有两个域类:用户 class User { String username String password String email Date dateCreated
问题陈述: 一个 pandas dataframe 列系列,same_group 需要根据两个现有列 row 和 col 的值从 bool 值创建。如果两个值在字典 memberships 中具有相似
apporable 报告以下错误: error: unknown type name 'MKMapItem'; did you mean 'MKMapView'? MKMapItem* destina
我有一个带有地址列的大型 DataFrame: data addr 0 0.617964 IN,Krishnagiri,635115 1 0.635428 IN,Chennai
我有一个列表list,里面有这样的项目 ElementA: Number=1, Version=1 ElementB: Number=1, Version=2 ElementC: Number=1,
我正在编译我的源代码,它只是在没有运行应用程序的情况下终止。这是我得到的日志: Build/android-armeabi-debug/com.app4u.portaldorugby/PortalDo
我正在尝试根据另一个单元格的值更改单元格值(颜色“红色”或“绿色”)。我运行以下命令: df.loc[0, 'Colour'] = df.loc[0, 'Count'].apply(lambda x:
我想弄清楚如何使用 StateT结合两个 State基于对我的 Scalaz state monad examples 的评论的状态转换器回答。 看来我已经很接近了,但是在尝试申请 sequence
如果我已经为它绑定(bind)了集合,我该如何添加 RibbonLibrary 默认的快速访问项容器。当我从 UI 添加快速访问工具项时,它会抛出 Operation is not valid whi
在我学习期间Typoclassopedia我遇到了这个证明,但我不确定我的证明是否正确。问题是: One might imagine a variant of the interchange law
我是一名优秀的程序员,十分优秀!