gpt4 book ai didi

python - 如何撤消 OpenAI Gym 中的操作?

转载 作者:太空宇宙 更新时间:2023-11-03 16:12:39 25 4
gpt4 key购买 nike

在 OpenAI Gym 中,我想知道同一状态下不同操作的下一个状态。例如,我想获取 s_1、s_2,其中我的环境动态是:

(s, a_1) -> s_1, (s, a_2) -> s_2

我找不到在不改变环境的情况下撤消操作或显示下一个状态的方法。我是否遗漏了一些明显的东西?

如果有帮助,我这样做是为了区分 LQR 的动态和奖励,并使用 InvertedPendulum 环境。

最佳答案

我发现一个名为 set_state 的方法正是执行此操作。可以在以下位置找到: https://github.com/openai/gym/blob/12e8b763d5dcda4962cbd17887d545f0eec6808a/gym/envs/mujoco/mujoco_env.py#L86-L92

关于python - 如何撤消 OpenAI Gym 中的操作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39147440/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com