python - 观察意义 - OpenAI Gym-6ren

python - 观察意义 - OpenAI Gym

转载作者：太空狗更新时间：2023-10-30 02:17:44

25

4

我想知道在 OpenAI Gym( https://gym.openai.com/ ) 中观察 CartPole-v0 的规范。

例如，在下面的代码中输出observation。一种观察结果类似于 [-0.061586 -0.75893141 0.05793238 1.15547541] 我想知道这些数字的含义。我想通过任何方式了解其他 Environments 的规范，例如 MountainCar-v0、MsPacman-v0 等等。

我尝试阅读 https://github.com/openai/gym ，但我不知道。你能告诉我如何了解规格吗？

import gym
env = gym.make('CartPole-v0')
for i_episode in range(20):
    observation = env.reset()
    for t in range(100):
        env.render()
        print(observation)
        action = env.action_space.sample()
        observation, reward, done, info = env.step(action)
        if done:
            print("Episode finished after {} timesteps".format(t+1))
            break

(来自 https://gym.openai.com/docs)

输出如下

[-0.061586   -0.75893141  0.05793238  1.15547541]
[-0.07676463 -0.95475889  0.08104189  1.46574644]
[-0.0958598  -1.15077434  0.11035682  1.78260485]
[-0.11887529 -0.95705275  0.14600892  1.5261692 ]
[-0.13801635 -0.7639636   0.1765323   1.28239155]
[-0.15329562 -0.57147373  0.20218013  1.04977545]
Episode finished after 14 timesteps
[-0.02786724  0.00361763 -0.03938967 -0.01611184]
[-0.02779488 -0.19091794 -0.03971191  0.26388759]
[-0.03161324  0.00474768 -0.03443415 -0.04105167]

最佳答案

OpenAI Gym中使用的观察空间与原论文并不完全相同。看OpenAI的wiki找到答案。观察空间为4维空间，各维度如下:

Num Observation 最小值最大值 0 推车位置 -2.4 2.4 1 购物车速度 -Inf Inf 2 极角 ~ -41.8° ~ 41.8° 尖端处的 3 极速度 -Inf Inf

关于python - 观察意义 - OpenAI Gym，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39341397/

25

4

0

文章推荐： python - 通过 Regex 操纵 Pandas 中的值

文章推荐： Python Pandas read_excel 无法识别空单元格

文章推荐： python - 使用相同的索引 pandas 按行合并两个数据帧

sorting - 如何在SAS中不进行排序的情况下删除重复的记录\观察？
我想知道是否有一种方法可以重复记录而不进行排序？有时候，我想保持原始顺序，只想删除重复的记录。是否可以？顺便说一句，以下是我所知道的有关重复记录的信息，这些记录最终会进行排序。 1。 proc s
java - 观察 for 循环内的实时数据
我想更新我的 Activity 中依赖于另一个列表的数据的列表。这两个数据列表都是从我的 View 模型的 Activity 中观察到的。从第一个列表获取数据后，我需要在此列表上运行 for 循环以获
javascript - 在函数内等待/观察
我无法理解这个问题。我怎样才能等待 i==2 完成然后再继续其他 i 的操作？ class Observable { constructor() { this.observer
javascript - 观察 @each 时了解哪个项目触发事件
我正在观察这样的 Ember Data RecordArray: myArray: function() { return MyRecord.find(); }.property(), isDir
ios - 观察 'strokeEnd'层动画事件
我想在动画开始时观察 strokeEnd 键路径。但是它不起作用，我哪里出错了？ - (void)addAnimation { // do animation CABasicAnima
javascript - 观察 Algorand 上的交易
是否可以在 Algorand 中观看某个交易，就像在以太坊中观看某个事件一样？最佳答案官方 algod 和 indexer API 目前不支持在 Algorand 上观看交易/事件。您可以通过使
swiftui - 观察 SwiftUI 中的框架变化
我有一个可以拖放到其他 View 之上的 View (可以说是类别)。为了检测我在哪个类别 View 之上，我将它们的帧存储在一个帧数组中，这发生在它们不可见叠加层的 onAppear 中。 (这基于
jquery - 观察 jQuery 中的显示变化
是否可以将观察者添加到可见性更改(即调用 show() 和 hide())时触发的 DOM 元素？谢谢! 最佳答案如果您想观察任何对 .show() 或 .hide() 的调用，并且可以访问 jQu
iphone - 观察 NSUserDefaults 键的值更改
我对保存在 NSUserdefaults 中的特定键的值变化感兴趣。然而，我所拥有的并不适合我。 observeValueForKeyPath 不会被触发。更新:我想我已经发现了这个问题。如果我使用
iphone - 观察 UITableView 中的捏合多点触控手势
我正在寻找在 UITableView 顶部实现捏入/捏出，我已经研究了几种方法，包括这个: Similar question 但是，虽然我可以创建一个 UIViewTouch 对象并将其覆盖到我的 U
cocoa - 观察 NSMutableArray - 仅使用数组访问器
我有一个在界面中公开的可变数组。我还公开了数组访问器来修改数组。如果数组内发生任何修改，我将不得不使用 KVO 重置并重新计算一些数据。为了支持 KVO，我使用 array accessors如下图:
iphone - 观察 NSPopupButton 的变化
当 NSPopupButton 发生变化时如何获得方法调用？谢谢! 最佳答案您只需添加一个操作方法，就像使用 NSButton 或任何其他控件一样。关于iphone - 观察 NSPopupBut
cocoa - 观察 Cocoa 中的键值对多关系
我正在尝试让键值观察适用于 NSMutableArray。下面是被观察类 MyObservee 的 .h 文件: @interface MyObservee : NSObject { @pri
javascript - 观察 NodeJS 集群是否退出
我很难理解让 Node.js 进程(异步)运行但仍然触发“退出”状态，以便在 CPU 处理完成后我可以做更多事情。例如，我有一个 Google 地方信息抓取工具，可以在所有可用的 CPU 上高效地分
go - 观察 pod 状态的所有变化
我正在尝试编写行为类似于kubectl get pods --watch . 这样，每次 pod 的状态发生变化时，我都会被触发。我创建了一个 go项目(在集群中运行)并添加以下代码: podsWa
javascript - 观察 div 何时隐藏或显示
我有这个代码: 当时我需要触发Javascript方法或具有给定 id 的 div 隐藏或显示，这将在屏幕调整大小期间发生(因此 u k-hidden-small )，这可以
couchbase - 观察 Couchbase 文档更改的推荐方法是什么？
我想使用 Couchbase，但我想在一些类似于 RethinkDB 的方式实现更改跟踪。似乎有很多方法可以将更改从 Couchbase 服务器推送给我。 DCP 点击 XDCR 哪一个是正确的选择
javascript - 观察 HTMLElements 上的隐式大小变化
虽然 MutationObserver 允许监视 HTMLElement 属性的显式大小更改，但它似乎没有一种方法/配置允许我监视其大小的隐式更改，这些更改是由浏览器。这是一个例子: const o
AngularJS 观察 DOM 变化
我有一个 auto-carousel 指令，它循环访问链接元素的子元素。但是，子级尚未加载到 DOM 中，因为它们的 ng-if 表达式尚未解析。如何确保父指令知道其 DOM 树已发生更改？
javascript - 观察 AngularJS 指令中函数的值
有没有办法观察 AngularJS 指令中函数表达式的值变化？我有以下 HTML 和 JavaScript，模板中 {{editable()}} 的插值显示该值计算为 true，而检查 Chrome

首页

博学

6Ren·AI

商城

python - 观察意义 - OpenAI Gym