python - 可以在 env.step 中返回 False 以某种方式返回 True 吗？ (健身房)-6ren

python - 可以在 env.step 中返回 False 以某种方式返回 True 吗？ (健身房)

转载作者：行者123 更新时间：2023-12-02 05:47:55

25

4

当我试图弄清楚 flocking env(来自 gym-flock)的重置条件时，我想到了这个问题:'return False' 能以某种方式返回 True 吗？？

核心代码是:

1: test_model.py 中 https://github.com/katetolstaya/multiagent_gnn_policies#available-algorithms

def test(args, actor_path, render=True):
# initialize gym env
env_name = args.get('env')
env = gym.make(env_name)
if isinstance(env.env, gym_flock.envs.FlockingRelativeEnv):
    env.env.params_from_cfg(args)

# use seed
seed = args.getint('seed')
env.seed(seed)
random.seed(seed)
np.random.seed(seed)
torch.manual_seed(seed)

# initialize params tuple
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
learner = DAGGER(device, args)
n_test_episodes = args.getint('n_test_episodes')
learner.load_model(actor_path, device)

**for _ in range(n_test_episodes):
    episode_reward = 0
    state = MultiAgentStateWithDelay(device, args, env.reset(), prev_state=None)
    done = False
    while not done:
        action = learner.select_action(state)
        next_state, reward, done, _ = env.step(action.cpu().numpy())
        next_state = MultiAgentStateWithDelay(device, args, next_state, prev_state=state)
        episode_reward += reward
        state = next_state
        if render:
            env.render()
    print(episode_reward)
env.close()**

2:gym环境代码:flocking_relative.py 中 https://github.com/katetolstaya/gym-flock/tree/stable/gym_flock/envs/flocking

    def step(self, u):

    #u = np.reshape(u, (-1, 2))
    assert u.shape == (self.n_agents, self.nu)
    #u = np.clip(u, a_min=-self.max_accel, a_max=self.max_accel)
    self.u = u * self.action_scalar

    # x position
    self.x[:, 0] = self.x[:, 0] + self.x[:, 2] * self.dt + self.u[:, 0] * self.dt * self.dt * 0.5
    # y position
    self.x[:, 1] = self.x[:, 1] + self.x[:, 3] * self.dt + self.u[:, 1] * self.dt * self.dt * 0.5
    # x velocity
    self.x[:, 2] = self.x[:, 2] + self.u[:, 0] * self.dt
    # y velocity
    self.x[:, 3] = self.x[:, 3] + self.u[:, 1] * self.dt

    self.compute_helpers()

    return (self.state_values, self.state_network), self.instant_cost(), **False**, {}

for while loop in test_model.py to break and reset env,在某些时候 done 应该是 True 。但是，env.step(代码第 2 部分)中的代码总是在 done 的位置返回 False。

当 env.step 总是返回 False 时，这个循环如何中断？我已经测试并确认这段代码工作正常，但是很难理解如何做。

请有RL和gym经验的帮帮我非常感谢您提前

最佳答案

https://github.com/katetolstaya/gym-flock/blob/stable/gym_flock/__init__.py#L65

在上面的文件中:

register(
    id='FlockingLeader-v0',
    entry_point='gym_flock.envs.flocking:FlockingLeaderEnv',
    max_episode_steps=200,
)

随着步数变为 max_episode_steps，步骤中的假返回真

关于python - 可以在 env.step 中返回 False 以某种方式返回 True 吗？ (健身房)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67734924/

25

4

0

文章推荐： google-apps-script - 在 Google 电子表格上集成 OpenAI

文章推荐： machine-learning - 对CNN中跳跃层的实现感到困惑

javascript - 错误: Unable to locate env file at default locations (./.env,./.env.js,./.env.json)
这个问题已经有答案了: env-cmd error failed to locate ./.env file in gatsby? (14 个回答) 已关闭 3 年前。我正在学习 Gatsby 教程
r - mgcv::gam 函数导致错误消息 "Error in reformulate(pav, env = p.env) : unused argument (env = p.env)"
我正在尝试使用 mgcv-package，但 mgcv::gam-function 只返回一条错误消息 Tmean = c(1,3,10,5,7) prec = c(300,500,700,600,5
Laravel - 为什么 Laravel 要求将 .env.example 重命名为 .env 而 .env 已经存在？
在 Laravel 6 中 Documentation Application Key的第二段是这样写的 Typically, this string should be 32 characters
javascript - 是否可以将动态变量传递给 process.env 来获取 env 变量？例如 process.env ['variable name' ]
我试图在创建消息时传递 sns 主题。但根据创建的变量，arn 可能会有所不同。例如，在环境变量中，我将有 3 个人及其主题。 john = arn:xxxxxxxx sally= arn:xxxx
node.js - 在 angular2 中使用 process.env.NODE_ENV 和 process.env.ENV 变量的原因是什么？
我开始学习 Angular2，我发现在示例中它们覆盖了配置文件中的 process.env.NODE_ENV 和 process.env.ENV 变量。此代码来自 this example 的 web
When I compile a kotlin native project I get "Could not initialize class org.jetbrains.kotlin.backend.konan.env.env", why?(当我编译一个kotlin native项目时，我得到“Could not initialize class org.jetbrains.kotlin.backend.konan.env.env”，为什么？)
我从头开始创建了一个Kotlin原生应用程序，我得到了上面的错误。我怎么才能解决这个问题呢？这是一款简单的“Hello World”应用程序。我有其他计算机，但该错误没有出现在那里。我认为这与科南没有
Dockerfile:在另一个 ENV 中引用先前定义的 ENV
我有一个 Dockerfile，我在其中设置了一些环境变量(在我运行容器时使用)。一些环境变量依赖于以前的环境变量。当我可以替换为一个变量时，我想保持干爽并避免多次对环境变量的值进行硬编码。在这个简
Dockerfile ENV 变量替换为另一个 ENV 变量
我正在学习 Docker 并面临将一个 env 变量的值替换为另一个 env 变量的问题。这是我的 Dockerfile FROM ubuntu ENV var_env=Tarun ENV comm
symfony - 将参数从 .env.dist 复制到 .env
我正在将一个项目从 Symfony 2.3 升级到 Symfony 3.4，我对 .env 和 .env.dist 文件之间的关系有点困惑。据我了解，它们之间的关系与Symfony2中paramete
Python:从特定的 .env 文件中获取 env 变量的值
在 python 中，有没有办法从特定的 .env 文件中检索 env 变量的值？例如，我有多个 .env 文件，如下所示: .env.a .env.a ... 我在 .env.b 中有一个名为 IN
javascript - 找不到名称 'ENV' returnTo : ENV. BASE_URI
我假设我的身份验证服务无法加载配置文件，从而导致错误。我正在关注 AUTH0 上的教程。这是链接 https://auth0.com/blog/real-world-angular-series-pa
docker - 如何使用 .env 文件中的环境变量填写同一个 .env 文件中的其他环境变量
我正在使用 base.env 作为我的几个 docker 服务的 env_file。在这个 base.env 中，我有几个部分的环境变量在整个文件中重复。例如，对于三个不同的环境变量，port 和 i
python - Django env 设置在检查是否设置了 env 变量之前进行评估
我正在尝试使用 values.SecretValue() 设置我的 aws 存储桶名称。要设置 Django 的媒体 url，我过去使用过: AWS_STORAGE_BUCKET_NAME = val
powershell - Windows $ env:path =“$($env:path);.”它在哪里添加的？
我通过从PowerShell运行$env:path ="$($env:path);."来“解决”一个问题。显然，它将当前目录添加到了我的路径。请添加到哪个路径变量？在我的环境变量对话框中，我会在哪里看
PowerShell:如何将 $env:HOSTNAME/$env:Computer) 作为文本替换的一部分插入到文本文件中？
我有一个很长的自定义应用程序配置文件，用于在工作站上运行的应用程序，其中一些文本元素必须在系统之间手动更改。这个脚本是为了让我的生活更轻松 - $content = Get-Content("C:\
laravel - Laravel指定与 `.env`不同的名称或将ingore设为 `.env`，以免与docker和docker-compose冲突
因为我使用docker和docker-compose而不是Homestead和任何基于Vargrant的开发解决方案，所以我想避免与laravel在.env文件的使用上发生冲突。因此，我希望larav
perl - 使用 -T 开关运行时 $ENV{ENV} 不安全
当我尝试最后一个例子时 perlfaq5: How-do-I-count-the-number-of-lines-in-a-file?我收到一条错误消息。我应该怎样做才能使脚本正常工作？ #!/usr
javascript - Docker:为什么从 .env 传递的变量即使从 .env 中删除并重建后仍会留在容器中
我试图理解为什么当我从我的 .env 文件中明确删除或注释掉它们时，我的 Docker 容器中的 env 变量仍然出现。我是 Docker 的新手，不知道这是预期的行为还是异常。我的系统设置方式是，
php - Python ENV 文件被 PHP ENV 覆盖
我正在使用 PHP 和 Laravel 框架，我使用 .env 来设置我的环境变量。然后我从我的 PHP 环境调用 python 脚本，并将结果返回给 PHP。我的问题是，在 Python 中设置的默
python - 新创建的 conda envs 是否继承了基础 env 的所有包？
我安装了 Anaconda 并创建了一个新环境(“dell_proj”)。然后我用我的新环境在 Pycharm 中创建了一个新项目。我的期望是我只能在这个项目中使用我通过 Conda 在特定环境中安装

首页

博学

6Ren·AI

商城

python - 可以在 env.step 中返回 False 以某种方式返回 True 吗？ (健身房)