python - 可以在 env.step 中返回 False 以某种方式返回 True 吗？ (健身房)-6ren

python - 可以在 env.step 中返回 False 以某种方式返回 True 吗？ (健身房)

转载作者：行者123 更新时间：2023-12-02 22:46:18

26

4

当我试图弄清楚 flocking env(来自 gym-flock)的重置条件时，我想到了这个问题:'return False' 能以某种方式返回 True 吗？？

核心代码是:

1: test_model.py 中 https://github.com/katetolstaya/multiagent_gnn_policies#available-algorithms

def test(args, actor_path, render=True):
# initialize gym env
env_name = args.get('env')
env = gym.make(env_name)
if isinstance(env.env, gym_flock.envs.FlockingRelativeEnv):
    env.env.params_from_cfg(args)

# use seed
seed = args.getint('seed')
env.seed(seed)
random.seed(seed)
np.random.seed(seed)
torch.manual_seed(seed)

# initialize params tuple
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
learner = DAGGER(device, args)
n_test_episodes = args.getint('n_test_episodes')
learner.load_model(actor_path, device)

**for _ in range(n_test_episodes):
    episode_reward = 0
    state = MultiAgentStateWithDelay(device, args, env.reset(), prev_state=None)
    done = False
    while not done:
        action = learner.select_action(state)
        next_state, reward, done, _ = env.step(action.cpu().numpy())
        next_state = MultiAgentStateWithDelay(device, args, next_state, prev_state=state)
        episode_reward += reward
        state = next_state
        if render:
            env.render()
    print(episode_reward)
env.close()**

2:gym环境代码:flocking_relative.py 中 https://github.com/katetolstaya/gym-flock/tree/stable/gym_flock/envs/flocking

    def step(self, u):

    #u = np.reshape(u, (-1, 2))
    assert u.shape == (self.n_agents, self.nu)
    #u = np.clip(u, a_min=-self.max_accel, a_max=self.max_accel)
    self.u = u * self.action_scalar

    # x position
    self.x[:, 0] = self.x[:, 0] + self.x[:, 2] * self.dt + self.u[:, 0] * self.dt * self.dt * 0.5
    # y position
    self.x[:, 1] = self.x[:, 1] + self.x[:, 3] * self.dt + self.u[:, 1] * self.dt * self.dt * 0.5
    # x velocity
    self.x[:, 2] = self.x[:, 2] + self.u[:, 0] * self.dt
    # y velocity
    self.x[:, 3] = self.x[:, 3] + self.u[:, 1] * self.dt

    self.compute_helpers()

    return (self.state_values, self.state_network), self.instant_cost(), **False**, {}

for while loop in test_model.py to break and reset env,在某些时候 done 应该是 True 。但是，env.step(代码第 2 部分)中的代码总是在 done 的位置返回 False。

当 env.step 总是返回 False 时，这个循环如何中断？我已经测试并确认这段代码工作正常，但是很难理解如何做。

请有RL和gym经验的帮帮我非常感谢您提前

最佳答案

https://github.com/katetolstaya/gym-flock/blob/stable/gym_flock/__init__.py#L65

在上面的文件中:

register(
    id='FlockingLeader-v0',
    entry_point='gym_flock.envs.flocking:FlockingLeaderEnv',
    max_episode_steps=200,
)

随着步数变为 max_episode_steps，步骤中的假返回真

关于python - 可以在 env.step 中返回 False 以某种方式返回 True 吗？ (健身房)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67734924/

26

4

0

文章推荐： google-apps-script - 在 Google 电子表格上集成 OpenAI

文章推荐： machine-learning - 对CNN中跳跃层的实现感到困惑

step - STEP 文件中无意义的数据重复
在我用 OpenCascade 生成的 STEP 文件中，我可以看到: #58 = VERTEX_POINT('',#59); #59 = CARTESIAN_POINT('',(-0.5,-0.5,
javascript - Firebug 中的 step into, step out 和 step over 是什么意思？
这个问题在这里已经有了答案: How to use Firebug's debugger functions? (1 个回答) 关闭 8 年前。我是 FireBug 调试器的新手，谁能告诉我什么是
WordPress 表单创建插件允许 : Step 1 > Step 2 > Step 3 > Submit
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，因为
java - 使用 eclipse IDE 的 selenium webdriver 中的 "Debug from step"、 "step over"、 "step into"
我想知道 Eclipse IDE 中是否存在任何功能，可以在执行 selenium 脚本时“从步骤进行调试” “单步执行”、“单步执行”。 “QTP” 和大多数专有功能自动化工具中都提供此功能。我假
step - .step 和 .stp 文件的文档或规范
我正在寻找 .stp/.step 文件的某种规范、文档、解释等。更多的是关于每行包含哪些信息而不是一般信息。我似乎无法自己弄清楚每个值的含义。有谁知道一些关于 STEP 文件的好读物？我已经搜
javascript - Bulma Steps 扩展没有 "step"
我写了下面的代码: Mockup TOPdesk
java - 无法进入java源代码。 "step into"不知何故表现得像 "step over"
我正在尝试研究 java String 类中的方法如何工作，因此我创建了一些调用该 String 类方法的自定义代码。如您所见，我在自己的代码中设置了一个断点，并且在 java String 类源代
javascript - 调用函数 "step by step"的正确方法
我有某些功能，需要我进行一个 api 调用来检索第二个 api 调用中使用的某个 id，逻辑上它看起来像这样: componentWillMount () { this.props.functio
python - 应用引擎 : Step-by-Step Debugging
在本地使用 AppEngine(即使用 dev_appserver.py)时，是否可以进行逐步调试？使用 logging.info() 或类似的函数来显示代码中所有变量的值并确定错误的位置是一种过时的
jquery-steps - JQuery 步骤 : how to disable a step?
我正在使用 JQuery Steps，它非常好。但事实证明有些事情很棘手。假设我在第 2 步。根据我在表单中选择的内容，我可能想在单击“下一步”时直接跳到第 4 步，并且进一步禁用第 3 步 anc
jquery-steps - 在 jquery-steps 中更改按钮的名称
我已经包含了 jquery-steps 插件。如何更改按钮文本？现在它说“完成”我想把它改成“去” 谢谢最佳答案查看以下内容 link .您可以在初始化时更改所有标签。 var setting
AngularJS Protractor : Step-by-step progress logs
在(现已弃用的) Angular 场景测试运行器中，有一个选项可以创建一个 runner.html 页面，该页面将在 iFrame 中运行测试，同时在主页中逐步报告进度。有没有办法获得类似的 Pro
jsf - p :steps but enable click on all steps
我有使用标签的 primefaces 步骤像下面这样: 结果是这样的: 我可以点击步骤 1，但不能点击步骤 3 和 4。如何为所有步骤启用点击？最佳答案哇，
java - Spring批量分区: Slave step with multiple steps
给定一个使用分区的 Spring Batch 作业，是否可以有多个分区步骤？例如: 在上面的示例中，是否可以将另一个分区
php - 检查数据库中是否存在记录 : in single step or two steps?
假设您要从数据库中获取一条记录，该记录返回大量数据并且需要多次连接。所以我的问题是，使用单个查询来检查数据是否存在并在存在时获取结果是否更好？或者做一个更简单的查询，检查数据是否存在然后id记录是否
aws-step-functions - 在 Step Functions 中创建任务时使用整数而不是字符串
我如何创建一个具有整数输入类型而不是字符串的任务，例如我想启动一个状态机: "SomeStage": { "Comment": "Getting busy
jquery-steps - 如何将 "reset"按钮添加到 JQuery-steps
我还没有看到有人问过这个问题——尽管我确实阅读了大约 100 个关于类似主题的 jQuery 步骤——似乎没有一个能解决我的问题。我正在使用 jQuery-steps 并希望在第一步完成后添加一个“
php - 拉维尔 5.3 : Migrate step by step
我想知道是否可以在 Laravel 5.3 中逐个迁移。我无法使 --step 选项正常工作，文档仅提及此选项与 rollback 或 refresh 一起使用命令。 // this works p
aws-step-functions - 如何使用文件中定义的状态机在本地执行 AWS Step Functions？
我已按照 AWS 文档中的步骤在本地设置和运行 AWS Step Functions:https://docs.aws.amazon.com/step-functions/latest/dg/sfn-
aws-step-functions - 如何使用文件中定义的状态机在本地执行 AWS Step Functions？
我已按照 AWS 文档中的步骤在本地设置和运行 AWS Step Functions:https://docs.aws.amazon.com/step-functions/latest/dg/sfn-

首页

博学

6Ren·AI

商城

python - 可以在 env.step 中返回 False 以某种方式返回 True 吗？ (健身房)