python - 如何解释 OpenAI gym 中 RAM 环境的观察结果？-6ren

python - 如何解释 OpenAI gym 中 RAM 环境的观察结果？

转载作者：行者123 更新时间：2023-11-28 20:02:40

25

4

在一些 OpenAI 健身房环境中，有一个“ram”版本。例如:Breakout-v0 和 Breakout-ram-v0。

使用 Breakout-ram-v0，每个观察值都是一个长度为 128 的数组。

问题:如何将 Breakout-v0(这是一张 160 x 210 图像)的观察结果转换为 Breakout- 的观察结果ram-v0(长度为128的数组)？

我的想法是在 Breakout-ram-v0 上训练一个模型，并显示使用 Breakout-v0 环境播放的训练模型。

最佳答案

有几种方法可以理解 ram 选项。

假设您想学习乒乓球。如果您从像素开始训练，您可能会使用多层卷积网络。有趣的是，convnet 的最终输出是一维特征数组。您将这些传递给完全连接的层，并可能根据卷积网络在图像中识别的特征输出正确的“ Action ”。或者，您可以使用处理一维特征阵列的强化层。

现在假设您觉得 pong 非常简单，并且可能用 16x16 的图像而不是 160x160 来表示。直接下采样不能提供足够的细节，因此您使用 openCV 来提取球和 Racket 的位置，并创建您的迷你版 16x16 乒乓球。具有漂亮、清晰的像素。代表游戏本质所需的计算比你的深层网络要少得多，而且你的新卷积网络又好又小。然后你意识到你甚至不再需要你的卷积网络了。您可以为每个 16x16 像素做一个完全连接的层。

所以，想想你有什么。现在你有 2 种不同的方法来获得游戏的简单表示，以训练你的全连接层。 (或 RL 算法)

您的深度卷积网络经过多个层并输出一维数组，例如最后一层中的 256 个特征。你将它传递给全连接层。
您的手动特征提取使用 OpenCV 提取 Blob (pattles/ball)，制作 16x16 乒乓球。通过将其传递到您的全连接层，它实际上只是一组 16x16=256“提取的特征”。

所以模式是您找到一种简单的方法来“表示”游戏状态，然后将其传递给您的全连接层。

进入选项3。游戏的RAM可能只是一个256字节的数组。但是你知道这包含游戏的“状态”，所以它就像你的 16x16 版本的乒乓球。它很可能是比您的 16x16“更好”的表示，因为它可能包含有关球的方向等信息。

所以现在您有 3 种不同的方法来简化游戏状态，以训练您的全连接层或强化算法。

因此，OpenAI 通过为您提供 RAM 所做的是帮助您避免学习游戏“表示”的任务，让您直接学习“策略”或根据状态做什么游戏的。

OpenAI 可能会提供一种在 ram 版本上“查看”视觉输出的方法。如果他们不这样做，您可以要求他们提供。但那是你能得到的最好的。他们不会对代码进行逆向工程以“渲染”RAM，也不会对代码进行逆向工程以基于像素“生成”“RAM”，这实际上是不可能的，因为像素只是状态的一部分游戏的。

如果 ram 对他们来说很容易获得，他们只会提供 ram，这样您就可以尝试学习算法，假设有一些东西可以给他们提供良好的状态表示。

没有(简单的)方法可以完成您的要求，例如将像素转换为 RAM，但很可能有一种方法可以要求 Atari 系统为您提供 ram 和像素，这样您就可以工作在 ram 上但显示像素。

关于python - 如何解释 OpenAI gym 中 RAM 环境的观察结果？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45207569/

25

4

0

文章推荐： python - 在 Python 中找到最低值并从多个列表中弹出

文章推荐： java - 如何将 JUnit 测试用例导出到可执行文件 .jar 中？

文章推荐： ios - UITableViewCell - 接收 Stepper 实例值

文章推荐： python - Tkinter Toplevel 总是在前面

openai-api - OpenAI API错误: Why do I still get the "module ' openai' has no attribute 'ChatCompletion' "error after I upgraded the OpenAI package and Python?
我收到以下错误:模块“openai”没有属性“ChatCompletion” 我检查了其他帖子。都在说升级OpenAI Python包或者升级Python。我都做了，但没有修复它。 Python:3.
openai-api - OpenAI API错误: Why do I still get the "module ' openai' has no attribute 'ChatCompletion' "error after I upgraded the OpenAI package and Python?
我收到以下错误:模块“openai”没有属性“ChatCompletion” 我检查了其他帖子。都在说升级OpenAI Python包或者升级Python。我都做了，但没有修复它。 Python:3.
openai-api - OpenAI 聊天完成可以完全确定吗？
我有一个用例，非常需要来自 OpenAI API 的完全确定性响应。然而，玩弄温度似乎无法产生完全的决定论。 import openai openai.organization = "org-..."
openai-api - openai GPT微调是否考虑损失函数中的提示？
OpenAI api 包含一个微调服务，将任务分为“提示”和“完成” https://platform.openai.com/docs/guides/fine-tuning 文档说准确度指标是根据完成
openai-api - Openai Context相关问题咨询
我通过openai的text-davinci-003可以正常返回对话信息，但是目前无法实现上下文关联功能。我搜索了一下，发现有一个“conversation_id”参数，但是添加该参数后，API返回“
openai-api - OpenAI 聊天完成可以完全确定吗？
我有一个用例，非常需要来自 OpenAI API 的完全确定性响应。然而，玩弄温度似乎无法产生完全的决定论。 import openai openai.organization = "org-..."
openai-api - openai GPT微调是否考虑损失函数中的提示？
OpenAI api 包含一个微调服务，将任务分为“提示”和“完成” https://platform.openai.com/docs/guides/fine-tuning 文档说准确度指标是根据完成
openai-api - Openai Context相关问题咨询
我通过openai的text-davinci-003可以正常返回对话信息，但是目前无法实现上下文关联功能。我搜索了一下，发现有一个“conversation_id”参数，但是添加该参数后，API返回“
python - OpenAI API 错误 : "No module named ' openai. embeddings_utils'； 'openai' 不是包”
我想使用 openai.embeddings_utils import get_embeddings所以已经安装了openai Name: openai Version: 0.26.5 Summary
openai-api - OpenAI GPT-3 API : How to keep the format of the OpenAI API response?
当我使用 GPT3 的 playground 时，我经常得到带有编号列表和段落格式的结果，如下所示: Here's what the above class is doing: 1. It creat
openai-api - OpenAI GPT-3 API : How to keep the format of the OpenAI API response?
当我使用 GPT3 的 playground 时，我经常得到带有编号列表和段落格式的结果，如下所示: Here's what the above class is doing: 1. It creat
python - OpenAI API 错误 : "No module named ' openai. embeddings_utils'； 'openai' 不是包”
我想使用 openai.embeddings_utils import get_embeddings所以已经安装了openai Name: openai Version: 0.26.5 Summary
Does openAI/chatGPT has an API's to Answer Questions from Multiple File uploads? and Does openAI/chatGPT file upload API support docx/pdf files?(OpenAI/chat GPT是否有API来回答来自多个文件上传的问题？OpenAI/chat GPT文件上传API是否支持docx/pdf文件？)
OpenAI/chat GPT也支持docx/pdf文件上传吗？。我想上传多个文件到openAI/chatGPT。我在https://platform.openai.com/docs/api-refe
openai-api - openAI/chatGPT 是否有 API 可以回答多个文件上传的问题？ openAI/chatGPT 文件上传 API 是否支持 docx/pdf 文件？
openAI/chatGPT也支持docx/pdf文件上传吗？我想上传多个文件到 openAI/chatGPT。我尝试了 https://platform.openai.com/docs/api-r
openai-api - openAI/chatGPT 是否有 API 可以回答多个文件上传的问题？ openAI/chatGPT 文件上传 API 是否支持 docx/pdf 文件？
openAI/chatGPT也支持docx/pdf文件上传吗？我想上传多个文件到 openAI/chatGPT。我尝试了 https://platform.openai.com/docs/api-r
openai-gym - 如何在渲染的 openAI 健身房环境中显示剧集
如果我们查看环境的预览，它们会在右下角的动画中显示剧集的增加。 https://gym.openai.com/envs/CartPole-v1/ .是否有明确显示的命令？最佳答案我认为 Ope
Azure OpenAI 嵌入与 OpenAI 嵌入
是否有人从使用 text-embedding-ada-002 的 Azure OpenAI 嵌入部署中获得的结果与 OpenAI 的结果不同？相同的文本，相同的模型，结果在向量空间中相差相当远。对于
openai-api - 如何强制 openai 保存整个聊天的上下文？
关闭。这个问题需要debugging details .它目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and th
openai-api - openai 未知命令 'tools'
我正在学习gpt微调我成功运行了这个命令:pip install --upgrade openai 我无法运行此命令:export OPENAI_API_KEY="sk-xxxxxxxxxxxxxx
openai-api - Openai API 继续输出以上内容
如何解决Openai API 不断输出的问题，比如让gpt api 写一篇文章。如果内容中断，可以继续提问，从而继续输出以上内容。这在ChatGPT中很容易做到，但是Openai API加上上面的提示

首页

博学

6Ren·AI

商城

python - 如何解释 OpenAI gym 中 RAM 环境的观察结果？