gpt4 book ai didi

algorithm - 强化学习中的 SARSA

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:33:28 24 4
gpt4 key购买 nike

我在无模型强化学习中遇到了 SARSA 算法。具体来说,在每个状态下,您将执行一个操作 a,然后观察一个新状态 s'

我的问题是,如果你没有状态转移概率方程 P{next state |当前状态 = s0},你怎么知道你的下一个状态是什么?

我的尝试:你只是简单地尝试那个 Action a,然后从环境中观察吗? enter image description here

最佳答案

通常是,您在环境中执行操作,环境会告诉您下一个状态是什么。

关于algorithm - 强化学习中的 SARSA,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50360618/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com