我正在使用 Python3.10 来了解 OpenAI 的 GYM (0.25.1),并将健身房的环境设置为'FrozenLake-v1(代码如下)。
根据文档,调用env.step()应返回一个包含 4 个值(观察、奖励、完成、信息)的元组。但是,当相应地运行我的代码时,我收到一个 ValueError:
有问题的代码:
observation, reward, done, info = env.step(new_action)
Run Code Online (Sandbox Code Playgroud)
错误:
3 new_action = env.action_space.sample()
----> 5 observation, reward, done, info = env.step(new_action)
7 # here's a look at what we get back
8 print(f"observation: {observation}, reward: {reward}, done: {done}, info: {info}")
ValueError: too many values to unpack (expected 4)
Run Code Online (Sandbox Code Playgroud)
添加一个变量可以修复错误:
a, b, c, d, e = env.step(new_action)
print(a, b, c, d, e)
Run Code Online (Sandbox Code Playgroud)
输出:
5 0 …Run Code Online (Sandbox Code Playgroud)