小编Mr.*_*ody的帖子

如何从 Mountain Car 的自定义初始状态启动环境?

我想从自定义初始点启动 OpenAI Gym 的连续山地车环境。OpenAI Gym 没有提供任何方法来做到这一点。我查看了环境的代码,发现有一个属性state保存状态信息。我尝试手动更改该属性。然而,它不起作用。

您可以看到附加的代码,从状态函数返回的观察结果与变量不匹配env.state

我认为这是一些基本的 Python 问题,不允许我访问该属性。有没有办法访问该属性或其他方式从自定义初始状态开始?我知道我可以从现有代码创建一个自定义环境(像这样)并添加功能。我在 Github 存储库中发现了一个问题,我认为他们也提出了这一点。

import gym
env = gym.make("MountainCarContinuous-v0")

env.reset()
print(env.state)
env.state = np.array([-0.4, 0])
print(env.state)

for i in range(50):
    obs, _, _, _ = env.step([1]) # Just taking right in every step   
    print(obs, env.state) #the observation and env.state is different
    env.render()
Run Code Online (Sandbox Code Playgroud)

代码的输出:

[-0.52196493  0.        ]
[-0.4  0. ]
[-0.52047719  0.00148775] [-0.4  0. ]
[-0.51751285  0.00296433] [-0.4  0. ]
[-0.51309416  0.00441869] [-0.4  0. …
Run Code Online (Sandbox Code Playgroud)

python openai-gym

6
推荐指数
1
解决办法
2252
查看次数

标签 统计

openai-gym ×1

python ×1