python - Python 中的 MCTS *tree* 并行化

python - Python 中的 MCTS tree 并行化 - 可能吗？

转载作者：太空宇宙更新时间：2023-11-04 02:16:16

25

4

我想并行化我的 MCTS 程序。有几种方法可以做到这一点:

叶并行化，其中每个叶并行展开和模拟。
根并行化，其中每个线程/进程创建一个单独的树，当完成一定数量的模拟时，树被合并以提供更好的统计数据
树并行化，其中所有线程/进程共享同一棵树，每个线程/进程探索树的不同部分。

(如果我的解释不清楚，请查看 this review paper on MCTS。在第 25 页，详细描述了并行化 MCTS 的不同方法。)

问题:

由于 Python 中的多处理必须创建单独的子进程，2. 根并行化非常适合，而我假设 3. 树并行化不可行。 (由于树并行化，所有子进程都必须共享同一棵树——这在 Python 中很难做到)

我说的对吗？我浏览了多处理文档，如果我理解正确，似乎是可以在某些基本数据类型的子进程之间来回传递信息，但由于速度等原因，我非常不鼓励。

如果是这样，Python 中的树并行化将不是一个好主意，对吧？

最佳答案

是的，您说得对，根并行化是这些变体中最容易实现的。不同的进程本质上将能够完全独立于彼此运行。只有在搜索过程结束时，您才需要以您选择的任何方式汇总结果，我认为这在实现时不会有问题。

我对 Python 中的多处理非常熟悉，知道当您需要更多通信时(其他两种方法需要的那种通信)，它……有点痛苦。我对它还不够熟悉，无法 100% 肯定地说它真的“不可能”或“非常不鼓励”，但在实现难易程度方面肯定存在明显差异。

关于python - Python 中的 MCTS *tree* 并行化 - 可能吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52584142/

25

4

0

文章推荐： python - 阅读连接查询 Sqlalchemy Jinja

文章推荐： html - CSS - 如何使链接按钮居中

文章推荐： Node.js 从 shell 管道读取后如何使用 stdin 流读取用户输入

文章推荐： python - 如何在 Pandas 中以分钟为单位获得时差

machine-learning - MCTS 搜索游戏中不同开始状态的树
我有一个关于 MCTS 的基本问题。我的问题是关于开始状态的处理。据我了解，搜索树是通过有效操作的分支来构建的，这会导致每次在相同状态下启动时遍历相同的搜索树。但是如果每次游戏开始时游戏的开始状态都不
algorithm - 了解 MCTS 节点选择
我目前正在尝试为我的一个项目实现 MCTS，但我不确定我是否正确理解了节点选择的概念。在游戏开始时，在我随机选择一个 Action 后，将整棵树展开到游戏结束点，然后进行反向传播，这个节点显然比其他所
artificial-intelligence - 带有评分系统的 MCTS UCT
我正在尝试通过蒙特卡罗树搜索解决 2048 的变体。我发现 UCT 是一种在探索/开发之间进行权衡的好方法。我唯一的问题是我见过的所有版本都假设得分是胜率。我怎样才能让它适应一个游戏，其中分数是最后
tree - 如何在复杂游戏中的 MCTS 中执行 Roll-out
好吧，我基本上了解 MCTS 如何与节点选择等一起工作。我不明白的是随机推出阶段。我随机模拟 future 的游戏步骤直到以赢或输结束，这是否正确？对于具有多种状态、可能的行动以及未知的敌人行动的更复
go - 如何运行以下 Golang MCTS 示例？
我试图掌握此实现的流程并弄清楚如何运行此 MCTS 实现:https://github.com/int8/gomcts/blob/master/README.md . 采取的步骤:我遵循了自述文件，但
我的 MCTS Gomoku 播放器的 Java 堆空间问题
当我运行我的程序时出现这个错误: Exception in thread "AWT-EventQueue-0" java.lang.OutOfMemoryError: Java heap space
tree - MCTS 处理 N 个玩家游戏的对手 Action
我想知道MCTS中如何处理N个玩家的游戏。对手的 Action 是否嵌入到搜索树中？它们的值(value)生成方式与其他操作相同吗？如果是这样，它们的值是否会以错误的方式改变父状态的总值(value)
machine-learning - MCTS 如何与 'precise lines' 配合使用
所以我熟悉更基本的树搜索算法，例如带有极小极大的游戏搜索，但我一直在尝试了解有关蒙特卡洛树搜索算法的更多信息，并且想知道它如何处理“精确线”。在国际象棋中，您可能会遇到 30 次失败但有 1 条获胜
python - Python 中的 MCTS *tree* 并行化 - 可能吗？
我想并行化我的 MCTS 程序。有几种方法可以做到这一点: 叶并行化，其中每个叶并行展开和模拟。根并行化，其中每个线程/进程创建一个单独的树，当完成一定数量的模拟时，树被合并以提供更好的统计数据树
c# - 我从官方 MCTS 考试 70-562 书中得到的小测试程序没有触发事件
我从官方 MCTS 考试 70-562 书中得到的小测试程序没有触发事件。我在 Debug模式下跟踪了计算机逻辑，它甚至没有进入我的事件，即使我已经设置好一切来处理它们。所以最大的问题是我做错了什么？
algorithm - 蒙特卡洛树搜索 : Opponent moves before MCTS tree border
MCTS算法的步骤是: 选择扩张模拟反向传播我的问题涉及第三步，模拟。我们用一个新节点扩展了我们的决策树，并模拟了剩余的 Action ，直到游戏结束。这个模拟可以分为两部分: 轮到我们利用决
asp.net - MCTS 70-515 培训套件， View 状态错误？
在本书的第 123 页 - 第 3 章，第 2 课。它说: ” Page.ViewState 属性提供了一个字典对象，用于在对同一页面的多个请求。此对象属于 StateBag 类型。当一个 ASP.
machine-learning - AlphaGo 零损失函数如何衡量 MCTS 概率和 NN 概率之间的相似性？
如图所示，AlphaGo Zero 神经网络使用损失函数，该函数使用 MCTS 概率和值作为真实标签。我试图了解神经网络的输出是否被视为逻辑(例如实值)或原始概率([0,1])。在损失函数中，看起来
c# - 这是 MCTS 自定进度培训套件(考试 70-536)中的错误吗？
我正在阅读 MCTS 自定进度培训工具包(考试 70-536):Microsoft .NET Framework — 应用程序开发基础，第二版电子书。现在我正在完成线程章节(第 7 期)。在第 2
asp.net - 70-515 MCTS 培训工具包在 ASP.NET 健康监控问题上是否有误？
在我的书“MCTS 自定进度培训工具包(考试 70-515):使用 Microsoft .NET Framework 4 进行 Web 应用程序开发”的第 418 页上有以下问题: You want

首页

博学

6Ren·AI

商城

python - Python 中的 MCTS tree 并行化 - 可能吗？