小编doe*_*ile的帖子

OpenAI GYM 的 env.step()：值是多少？

我正在使用 Python3.10 来了解 OpenAI 的 GYM (0.25.1)，并将健身房的环境设置为'FrozenLake-v1（代码如下）。

根据文档，调用env.step()应返回一个包含 4 个值（观察、奖励、完成、信息）的元组。但是，当相应地运行我的代码时，我收到一个 ValueError：

有问题的代码：

observation, reward, done, info = env.step(new_action)

Run Code Online (Sandbox Code Playgroud)

错误：

      3 new_action = env.action_space.sample()
----> 5 observation, reward, done, info = env.step(new_action)
      7 # here's a look at what we get back
      8 print(f"observation: {observation}, reward: {reward}, done: {done}, info: {info}")

ValueError: too many values to unpack (expected 4)

Run Code Online (Sandbox Code Playgroud)

添加一个变量可以修复错误：

a, b, c, d, e = env.step(new_action)
print(a, b, c, d, e)

Run Code Online (Sandbox Code Playgroud)

输出：

5 0 …

Run Code Online (Sandbox Code Playgroud)

python openai-gym valueerror

doe*_*ile

2022 08-01

14
推荐指数

2
解决办法

3万
查看次数

标签统计

openai-gym ×1

python ×1

valueerror ×1

OpenAI GYM 的 env.step()：值是多少？

标签 统计

小编doe_ile的帖子

标签统计