小编doe*_*ile的帖子

OpenAI GYM 的 env.step():值是多少?

我正在使用 Python3.10 来了解 OpenAI 的 GYM (0.25.1),并将健身房的环境设置为'FrozenLake-v1(代码如下)。

根据文档,调用env.step()应返回一个包含 4 个值(观察、奖励、完成、信息)的元组。但是,当相应地运行我的代码时,我收到一个 ValueError:

有问题的代码:

observation, reward, done, info = env.step(new_action)
Run Code Online (Sandbox Code Playgroud)

错误:

      3 new_action = env.action_space.sample()
----> 5 observation, reward, done, info = env.step(new_action)
      7 # here's a look at what we get back
      8 print(f"observation: {observation}, reward: {reward}, done: {done}, info: {info}")

ValueError: too many values to unpack (expected 4)
Run Code Online (Sandbox Code Playgroud)

添加一个变量可以修复错误:

a, b, c, d, e = env.step(new_action)
print(a, b, c, d, e)
Run Code Online (Sandbox Code Playgroud)

输出:

5 0 …
Run Code Online (Sandbox Code Playgroud)

python openai-gym valueerror

14
推荐指数
2
解决办法
3万
查看次数

标签 统计

openai-gym ×1

python ×1

valueerror ×1