- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
当我运行我的程序时出现这个错误:
Exception in thread "AWT-EventQueue-0" java.lang.OutOfMemoryError: Java heap space
at MCTSNode.setPossibleMoves(MCTSNode.java:66)
at MCTSNode.Expand(MCTSNode.java:167)
at MctsPlayer.getBestMove(MctsPlayer.java:39)
at NewBoardGUI.btnClick(NewBoardGUI.java:617)
at NewBoardGUI.lambda$createButton$0(NewBoardGUI.java:584)
at NewBoardGUI$$Lambda$115/558922244.actionPerformed(Unknown Source)
at java.desktop/javax.swing.AbstractButton.fireActionPerformed(Unknown Source)
at java.desktop/javax.swing.AbstractButton$Handler.actionPerformed(Unknown Source)
at java.desktop/javax.swing.DefaultButtonModel.fireActionPerformed(Unknown Source)
at java.desktop/javax.swing.DefaultButtonModel.setPressed(Unknown Source)
at java.desktop/javax.swing.plaf.basic.BasicButtonListener.mouseReleased(Unknown Source)
at java.desktop/java.awt.Component.processMouseEvent(Unknown Source)
at java.desktop/javax.swing.JComponent.processMouseEvent(Unknown Source)
at java.desktop/java.awt.Component.processEvent(Unknown Source)
at java.desktop/java.awt.Container.processEvent(Unknown Source)
at java.desktop/java.awt.Component.dispatchEventImpl(Unknown Source)
at java.desktop/java.awt.Container.dispatchEventImpl(Unknown Source)
at java.desktop/java.awt.Component.dispatchEvent(Unknown Source)
at java.desktop/java.awt.LightweightDispatcher.retargetMouseEvent(Unknown Source)
at java.desktop/java.awt.LightweightDispatcher.processMouseEvent(Unknown Source)
at java.desktop/java.awt.LightweightDispatcher.dispatchEvent(Unknown Source)
at java.desktop/java.awt.Container.dispatchEventImpl(Unknown Source)
at java.desktop/java.awt.Window.dispatchEventImpl(Unknown Source)
at java.desktop/java.awt.Component.dispatchEvent(Unknown Source)
at java.desktop/java.awt.EventQueue.dispatchEventImpl(Unknown Source)
at java.desktop/java.awt.EventQueue.access$500(Unknown Source)
at java.desktop/java.awt.EventQueue$3.run(Unknown Source)
at java.desktop/java.awt.EventQueue$3.run(Unknown Source)
at java.base/java.security.AccessController.doPrivileged(Native Method)
at java.base/java.security.ProtectionDomain$JavaSecurityAccessImpl.doIntersectionPrivilege(Unknown Source)
at java.base/java.security.ProtectionDomain$JavaSecurityAccessImpl.doIntersectionPrivilege(Unknown Source)
at java.desktop/java.awt.EventQueue$4.run(Unknown Source)
我对 3x3 板尺寸使用了相同的 MCTS 代码,它不会崩溃并能快速返回有竞争力的 Action 。但是当我尝试将它用于 15x15 的棋盘尺寸时,游戏在 1235 次迭代后崩溃,并出现上述错误。
我想我已经通过在 1235 次迭代后不允许扩展任何节点来处理问题的症状。这最终确实会带来竞争性举措,尽管这需要很长时间才能发生。
对我来说,根本原因是我试图创建的树的大小,因为相同的代码适用于 3x3 板,但不适用于 15x15 板;包含所有节点对象的树的大小太大了。因此,这只是这种方法的问题,而不是我的编码问题。
我确实认为我可以尝试:在 x 次迭代后,如果某个节点已被访问 y 次但获胜分数低于 z,则删除该节点。我的想法是,如果在 x 次迭代后,被访问了 y 次但获胜分数仍然很低,那么这个节点很可能在树中占用了不必要的空间,因此可以删除。
我的问题是:
有没有更好的方法让我的程序返回移动而不是崩溃,而不仅仅是减少扩展的数量并且不必执行上述检查? (即使最好的走法需要很长时间才能计算出来)。
这是我的一些未经编辑的代码:
已编辑** MCTS 扩展函数:
public MCTSNode Expand(BoardGame game){
MCTSNode child = new MCTSNode(game);
for(int k = 0;k<this.gameState[0].length;k++){
for(int l = 0;l<this.gameState[1].length;l++){
child.gameState[k][l] = this.gameState[k][l];
}
}
Random r = new Random();
int possibleMoveSelected = r.nextInt(getPossibleMovesList());
int row = getPossibleMoveX(possibleMoveSelected);
int col = getPossibleMoveY(possibleMoveSelected);
if(this.currentPlayer==2){
child.gameState[row][col] = 2;
child.moveMadeRow = row;
child.moveMadeCol = col;
child.currentPlayer = 1;
child.setPossibleMoves();
child.possibleMoves.size();
}
else{
child.gameState[row][col] = 1;
child.moveMadeRow = row;
child.moveMadeCol = col;
child.currentPlayer = 2;
child.setPossibleMoves();
child.possibleMoves.size();
}
childrenNode.add(child);
child.parentNode = this;
this.removePossibleMove(possibleMoveSelected);
this.possibleMoves.trimToSize();
return this;
}
MCTSPlayer 函数:
public class MctsPlayer {
private static int maxIterations;
public MctsPlayer(int i){
maxIterations = i;
}
public static String getBestMove(BoardGame game){
MCTSNode root = new MCTSNode(game);
root.getBoardState(game);
root.setPossibleMoves();
for(int iteration = 0; iteration < maxIterations; iteration++){
MCTSNode initialNode = selectInitialNode(root);
if(initialNode.getPossibleMovesList()>0){
initialNode.Expand(game);
}
MCTSNode nodeSelected = initialNode;
if(nodeSelected.childrenLeft() == true){
nodeSelected = initialNode.getRNDChild();
}
nodeSelected.Simulate();
}
MCTSNode best = root.getMostVisitNode();
System.out.println("This is the selected node's best move for the row: "+best.getMoveMadeRow());
System.out.println("This is the selected node's best move for the col: "+best.getMoveMadeCol());
best.printNodeInfo();
}
新包含在下面**
选择初始节点函数(将继续直到可能的移动列表大小 == 到 0):
public static MCTSNode selectInitialNode(MCTSNode node){
MCTSNode initialNode = node;
while (initialNode.getPossibleMovesSize()==0&&initialNode.checkForEmptySpace()==true){
initialNode = initialNode.Select();
"+initialNode.childrenList()); //System.out.println("剩余节点可能移动数:"+initialNode.getPossibleMovesSize()); } 返回初始节点;
选择功能:
public MCTSNode Select(){
double maxUCT = Integer.MIN_VALUE;
MCTSNode Node = this;
if(this.possibleMoves.size()>0){
return Node;
}
else{
for(int i = 0;i<childrenNode.size();i++){
double UCTValue = getUCTValue(getChildren(i));
if(UCTValue > maxUCT){
Node = getChildren(i);
maxUCT = UCTValue;
}
}
return Node;
}
private double getUCTValue(MCTSNode childNode) {
double UCTValue;
if (childNode.getVisitCount() >= 1) {
UCTValue = (Math.sqrt(2)*
(Math.sqrt(Math.log(childNode.getParent().getVisitCount()* 1.0) / childNode.getVisitCount())) + (1.0 *childNode.getWinCount() / childNode.getVisitCount()* 1.0));
} else {
UCTValue = Double.MAX_VALUE;
}
return UCTValue;
}
childrenLeft 函数:
public boolean childrenLeft(){
return childrenNode.size()>0;
}
最佳答案
如果没有看到 childrenLeft()
和其他一些方法的代码,我不能 100% 确定,但我的印象是你基本上添加了 b
new树的节点,其中 b
是您的分支因子。换句话说,每次迭代,您都会向一个节点添加一个新的、完整的子节点列表。这可能确实会导致您很快耗尽内存。
到目前为止,最常见的策略是通过每次迭代仅添加一个新节点来扩展您的树。然后每个节点需要:
一旦到达具有要展开的非空操作列表的节点,您的选择阶段通常就会结束。然后 MCTS 会从该列表中随机选择一个 Action ,添加一个与该 Action 对应的新节点(意味着您的第一个列表增加一个条目,第二个列表缩小一个条目),然后从那里继续推出。
有了这样的实现,除非您允许您的算法搜索很长时间,否则内存不足的可能性很小。如果仍然内存不足,您可以查看以下内容:
关于我的 MCTS Gomoku 播放器的 Java 堆空间问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53558933/
我有一个关于 MCTS 的基本问题。我的问题是关于开始状态的处理。据我了解,搜索树是通过有效操作的分支来构建的,这会导致每次在相同状态下启动时遍历相同的搜索树。但是如果每次游戏开始时游戏的开始状态都不
我目前正在尝试为我的一个项目实现 MCTS,但我不确定我是否正确理解了节点选择的概念。在游戏开始时,在我随机选择一个 Action 后,将整棵树展开到游戏结束点,然后进行反向传播,这个节点显然比其他所
我正在尝试通过蒙特卡罗树搜索解决 2048 的变体。我发现 UCT 是一种在探索/开发之间进行权衡的好方法。 我唯一的问题是我见过的所有版本都假设得分是胜率。我怎样才能让它适应一个游戏,其中分数是最后
好吧,我基本上了解 MCTS 如何与节点选择等一起工作。我不明白的是随机推出阶段。我随机模拟 future 的游戏步骤直到以赢或输结束,这是否正确?对于具有多种状态、可能的行动以及未知的敌人行动的更复
我试图掌握此实现的流程并弄清楚如何运行此 MCTS 实现:https://github.com/int8/gomcts/blob/master/README.md . 采取的步骤:我遵循了自述文件,但
当我运行我的程序时出现这个错误: Exception in thread "AWT-EventQueue-0" java.lang.OutOfMemoryError: Java heap space
我想知道MCTS中如何处理N个玩家的游戏。对手的 Action 是否嵌入到搜索树中?它们的值(value)生成方式与其他操作相同吗?如果是这样,它们的值是否会以错误的方式改变父状态的总值(value)
所以我熟悉更基本的树搜索算法,例如带有极小极大的游戏搜索,但我一直在尝试了解有关蒙特卡洛树搜索算法的更多信息,并且想知道它如何处理“精确线”。 在国际象棋中,您可能会遇到 30 次失败但有 1 条获胜
我想并行化我的 MCTS 程序。有几种方法可以做到这一点: 叶并行化,其中每个叶并行展开和模拟。 根并行化,其中每个线程/进程创建一个单独的树,当完成一定数量的模拟时,树被合并以提供更好的统计数据 树
我从官方 MCTS 考试 70-562 书中得到的小测试程序没有触发事件。我在 Debug模式下跟踪了计算机逻辑,它甚至没有进入我的事件,即使我已经设置好一切来处理它们。所以最大的问题是我做错了什么?
MCTS算法的步骤是: 选择 扩张 模拟 反向传播 我的问题涉及第三步,模拟。我们用一个新节点扩展了我们的决策树,并模拟了剩余的 Action ,直到游戏结束。这个模拟可以分为两部分: 轮到我们利用决
在本书的第 123 页 - 第 3 章,第 2 课。它说: ” Page.ViewState 属性提供了一个字典对象,用于在 对同一页面的多个请求。此对象属于 StateBag 类型。当一个 ASP.
如图所示,AlphaGo Zero 神经网络使用损失函数,该函数使用 MCTS 概率和值作为真实标签。我试图了解神经网络的输出是否被视为逻辑(例如实值)或原始概率([0,1])。在损失函数中,看起来
我正在阅读 MCTS 自定进度培训工具包(考试 70-536):Microsoft .NET Framework — 应用程序开发基础,第二版电子书。 现在我正在完成线程章节(第 7 期)。在第 2
在我的书“MCTS 自定进度培训工具包(考试 70-515):使用 Microsoft .NET Framework 4 进行 Web 应用程序开发”的第 418 页上有以下问题: You want
我是一名优秀的程序员,十分优秀!