- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我目前正在开发一个解决方案,一个基于技巧的纸牌游戏称为Skat在一个完美的信息情况。虽然大多数人可能不知道这个游戏,但请容忍我,我的问题是一般性的。
SKAT简介:
基本上,每个玩家轮流玩一张牌,每三张牌就形成一个戏法。每张卡都有特定的价值。一个玩家所获得的分数是将其所赢得的每一张牌的价值相加的结果。我漏掉了一些对我的问题不重要的事情,例如谁对谁,我什么时候赢一个把戏。
我们应该记住的是,有一个连续的分数,谁在调查某个位置时打了什么(->它的历史)与该分数有关。
我用Java编写了一个alpha-beta算法,它看起来工作得很好,但是速度太慢了最有希望的第一个改进是使用换位表。我读到在搜索skat游戏树的时候,你会遇到很多已经被调查过的位置。
这就是我的问题所在:如果我找到一个之前已经调查过的位置,那么导致这个位置的移动是不同的。因此,一般来说,分数(和α或β)也会有所不同。
这就引出了我的问题:如果我知道同一个职位的价值,但又有不同的历史,我如何确定这个职位的价值?
换言之:如何将子树从其路径分离到根,以便将其应用到新路径?
我的第一个冲动是这是不可能的,因为alpha或beta可能受到其他路径的影响,这些路径可能不适用于当前位置,但是……
似乎已经有了解决办法
…我好像不明白在Sebastion Kupferschmid关于Skat解算器的硕士论文中,我发现了这段代码(可能是C-ish/伪代码?)以下内容:
def ab_tt(p, alpha, beta):
if p isa Leaf:
return 0
if hash.lookup(p, val, flag):
if flag == VALID:
return val
elif flag == LBOUND:
alpha = max(alpha, val)
elif flag == UBOUND:
beta = min(beta, val)
if alpha >= beta:
return val
if p isa MAX_Node:
res = alpha
else:
res = beta
for q in succ(p):
if p isa MAX_Node:
succVal = t(q) + ab_tt(q, res - t(q), beta - t(q))
res = max(res, succVal)
if res >= beta:
hash.add(p, res, LBOUND)
return res
elif p isa MIN_Node:
succVal = t(q) + ab_tt(q, alpha - t(q), res - t(q))
res = min(res, succVal)
if res <= alpha:
hash.add(p, res, UBOUND)
return res
hash.add(p, res, VALID)
return res
succ(p)
是返回当前位置的所有可能移动的函数
t(q)
是我认为的各自位置的连续得分(到目前为止由宣布者获得的分数)。
ab_tt(q, res - t(q), beta - t(q))
],这似乎是某种脱钩但是如果我们把位置的值存储在换位表中,而不在这里做同样的减法,到底有什么好处呢?如果我们发现了一个先前调查过的位置,为什么我们可以返回它的值(如果它是
VALID
)或者使用alpha或beta的绑定值?在我看来,从换位表中存储和检索值并不能解释这些位置的特定历史还是会呢?
Rank J A 10 K Q 9 8 7
Value 2 11 10 4 3 0 0 0
最佳答案
我解决了这个问题。根据我问题中引用的建议,每次递归调用都要做奇怪的减法运算,只有在换位表中存储一个位置时,我才会从得到的alpha beta值中减去运行分数:
对于精确的值(位置尚未修剪):
transpo.put(hash, new int[] { TT_VALID, bestVal - node.getScore()});
transpo.put(hash, new int[] { TT_LBOUND, bestVal - node.getScore()});
transpo.put(hash, new int[] { TT_UBOUND, bestVal - node.getScore()});
transpo
是一个
HashMap<Long, int[]>
hash
是表示该位置的
long
值
bestVal
是精确值或导致截断的值
TT_VALID
、
TT_LBOUND
和
TT_UBOUND
是简单的常量,用于描述换位表条目的类型
TT_VALID
)时,我应该只存储位置,这样可以提高alpha。
关于algorithm - 如何在换位表中说明头寸历史,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21688552/
我正在查看预先重写的 jQuery 代码。我无法理解以下代码。 $('body > *:not(#print-modal):not(script)').clone(); 最佳答案 此选择器匹配以下任何
所以我开始学习MySQL,我对表有点困惑,所以我想澄清一下。数据库中可以有多个表吗?例如: Database1 -Table1 -Username -Password -Table2 -Name
我在 PostgreSQL 中编写了一个函数,其代码如下: for (i = 0; i str[0][i]); values[i] = datumCopy(dat_value,
oid: 行的对象标识符(对象 ID)。这个字段只有在创建表的时候使用了 WITH OIDS ,或者是设置了default_with_oids 配置参数时出现。 这个字段的类型是 oid (和字段同
我在搜索最大连接设备数时发现了 a post大致说: 当使用 P2P_STAR 时,最大设备数量为 10,因为此 topoly 使用 Wi-Fi 热点。也就是说,如果您没有路由器。 这让我问了两个问题
我不明白为什么会这样: Printf.sprintf "%08s" "s" = Printf.sprintf "%8s" "s" - : bool = true 换句话说,我希望: Printf.sp
我正在遵循 Grails in Action 中的示例。我有一个问题,如何理解 addTo*()功能有效。 我有一个简单的域:具有以下关系的用户、帖子、标签: 用户1对M发帖 用户一对一标签 发布 M
请问为什么行 "b[0]= new Child2();"在运行时而不是在编译时失败。请不要检查语法,我只是在这里做了 class Base {} class Child1 : Base {} clas
所以我想进一步加深我对套接字的理解,但是我想首先从最低级别开始(在C语言中,而不是在汇编中大声笑) 但是,我处理的大多数站点都使用SOCK_STREAM或SOCK_DGRAM。但是我已经阅读了Beej
好吧,我对 javascript 语法了解甚少,而且我对 null 的行为感到非常困惑。关于空值有很多讨论,但我似乎无法找出问题所在!请帮我。这是脚本。 var jsonData = '';
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭5 年前。 Improve thi
问题: SeriesSum 类旨在计算以下系列的总和: 类名:SeriesSum 数据成员/实例变量: x:存储整数 n:存储术语数量 sum:用于存储系列总和的双变量 成员函数: SeriesSum
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
今天我在 logcat 中注意到以下内容: D/OpenGLRenderer:0xa2c70600 (CardView) 上的 endAllStagingAnimators,句柄为 0xa2c9d35
如何创建值有序对的列表,例如list1 [(x, y), (x1, y1) ...].?? 学习如何创建此列表后,我需要知道如何将 x 值提供给列表中的用户输入并搜索 x 的下一个值并显示有序对 (x
我在存储过程中有以下逻辑。 这里完成了什么? 如果color为null,替换为'' IF ISNULL(@color, '') <> '' BEGIN END 最佳答案 它等同于: IF (@colo
我知道.Net中的接口(interface)定义了接口(interface)和继承它的类之间的契约。刚刚完成了一个大量使用数据访问层接口(interface)的项目,这让我开始思考。 . .有什么大不
如何防止基类方法被子类覆盖 最佳答案 您不需要做任何特别的事情:默认情况下方法是不可覆盖的。相反,如果您希望该方法可重写,则必须将 virtual 关键字添加到其声明中。 但是请注意,即使方法不可重写
我已阅读以下有关工厂模式的文章 here 请仅引用Class Registration - avoiding reflection这一部分。 这个版本在没有反射的情况下实现了工厂和具体产品之间的减少耦
我正在学习 Java 类(class),但无法完全理解下一课的内容。 目的:本课的目的是通过创建一个模拟 for-each 循环如何工作的替代方案来解释 for-each 循环的工作方式。 在上一课中
我是一名优秀的程序员,十分优秀!