gpt4 book ai didi

machine-learning - 是否可以在训练前和训练期间修改 OpenAI 健身房状态?

转载 作者:行者123 更新时间:2023-12-02 05:46:36 25 4
gpt4 key购买 nike

我想做的是修改一个环境,例如 super 马里奥兄弟健身房环境,模糊代理训练的图像,看看强化学习代理是否仍然能够在这些“模糊”上学习"状态。

OpenAI 是否可以做这样的事情?我将如何添加健身房环境预处理步骤?

最佳答案

我建议您为您的健身房环境制作一个包装器,在 step()reset() 函数中添加处理

这里有一些代码来说明这个想法:

class EnvWrapper(gym.Env):
def __init__(self, config):
self.env = gym.make("Your-Env-Name") # The wrapper encapsulates the gym env

def step(self, action):
obs, reward, done, info = self.env.step(action) # calls the gym env methods
obs = self._blur(obs) # applies your specific treatment
return obs, reward, done, info

def reset(self):
obs = self.env.reset() # same for reset
return self._blur(obs)

def _blur(self):
do_whatever_you_need

使用这种方法不需要对原有环境做任何改动,一般来说是个好主意

关于machine-learning - 是否可以在训练前和训练期间修改 OpenAI 健身房状态?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64773220/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com