gpt4 book ai didi

reinforcement-learning - batch q learning和growing batch q learning的区别

转载 作者:行者123 更新时间:2023-12-02 01:33:22 24 4
gpt4 key购买 nike

我对 batch 和 growing batch q 学习之间的区别感到困惑。另外,如果我只有历史数据,是否可以实现 growing batch q learning?

谢谢!

最佳答案

在批量 Q 学习中,您只有历史数据,不可能按照给定的策略获取新数据。相反,在增长批量 Q-learning 中,算法几乎相同,不同之处在于在某些迭代中,您使用中间策略来获取更多数据,从而使用新数据(包含探索)来增长数据批处理。

因此,如果您只有历史数据,则不可能使用新数据来增加批处理。也就是说,在您的情况下,不可能实现不断增长的批量 Q 学习。

你可以在本书的第2章阅读详细解释:Wiering, Marco, y Martijn van Otterlo, eds.强化学习:最先进的。 2012.ª 编。施普林格,2012 年。Link to the chapter

关于reinforcement-learning - batch q learning和growing batch q learning的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32825178/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com