OpenAi 的 Gym 使用的 Discrete 和 Box 数据类型是什么?

Tob*_*biq 4 openai-gym

它们看起来都像矩阵/数组。

我不太懂Python,这些通用数据类型是Python中使用的还是特定于健身房的?

我正在阅读 API,但仍然对它们到底是什么感到困惑。


例如(来自文档)

print(env.action_space)
#> Discrete(2)
print(env.observation_space)
#> Box(4,)
Run Code Online (Sandbox Code Playgroud)

为什么方框后面有一个逗号?这是不是代表着什么。

Discrete数据类型和类型有什么区别Box

根据我收集的数据,里面的数字就是尺寸。

类似于Discrete数组又Box类似于矩阵?

小智 6

离散是代理可以采取的动作的集合,其中每一步只能选择一个。在这种情况下,操作没有变化。例如,如果您有一个智能体穿越网格世界,离散空间中的动作可能会告诉智能体向前移动,但它们向前移动的距离是一个常数。

Box定义了代理可以行动的空间,并允许在网格世界场景中可变的前进距离。

MultiDiscrete允许同时执行多个操作,类似于Box,但与Discrete一样,要么执行,要么不执行。没有 0.1 的前进步长。

查看此问题以获取有关如何使用Box 的更多信息。

我没有找到很好的内置文档,但查看源代码中的注释可能会有所帮助。