gpt4 book ai didi

machine-learning - 何时使用蒙特卡罗而不是 TD 学习,反之亦然

转载 作者:行者123 更新时间:2023-11-30 08:57:07 26 4
gpt4 key购买 nike

在研究强化学习时,尤其是在无模型强化学习方面,我们通常使用两种方法:

  • TD 学习
  • 蒙特卡罗

什么时候使用其中一个而不是另一个?换句话说,我们如何找出最适合我们的问题的方法?

最佳答案

Sutton & Barto 的第 6.1 和 6.2 节对蒙特卡洛和 TD 学习之间的差异有一个非常直观的理解。

话虽如此,MC 方法与非情景任务当然存在明显的不兼容性。在这种情况下,您将始终需要某种引导。

关于machine-learning - 何时使用蒙特卡罗而不是 TD 学习,反之亦然,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55892280/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com