安装稳定基线的正确方法?

Rap*_*ael 0 python stable-baselines

我正在尝试安装 stable-baselines 并运行在线手册的“入门”部分中的前两行,但没有任何选项起作用。我开始于

pip install stable-baselines
Run Code Online (Sandbox Code Playgroud)

现在当我跑步时:

import gym
from stable_baselines.common.policies import MlpPolicy
Run Code Online (Sandbox Code Playgroud)

我明白了

No module named 'tensorflow.contrib'
Run Code Online (Sandbox Code Playgroud)

这显然是因为tensorflow版本2没有tensorflow.contrib。但版本 2 于 2019 年 9 月发布。我真的必须只使用 TensorFlow 版本 1 吗?

安装 stable-baselines 并运行这个简单示例的正确方法是什么?


我试过

pip install stable-baselines3 
Run Code Online (Sandbox Code Playgroud)

在虚拟环境中。这会产生不同的错误:

In [2]: from stable_baselines.common.policies import MlpPolicy
---------------------------------------------------------------------------
ModuleNotFoundError                       Traceback (most recent call last)
Input In [2], in <module>
----> 1 from stable_baselines.common.policies import MlpPolicy

ModuleNotFoundError: No module named 'stable_baselines'

In [3]: from stable_baselines3.common.policies import MlpPolicy
---------------------------------------------------------------------------
ImportError                               Traceback (most recent call last)
Input In [3], in <module>
----> 1 from stable_baselines3.common.policies import MlpPolicy

ImportError: cannot import name 'MlpPolicy' from 'stable_baselines3.common.policies' (/home/raph/RL/stable-baselines/venv/lib/python3.8/site-packages/stable_baselines3/common/policies.py)
Run Code Online (Sandbox Code Playgroud)

And*_*dré 5

引用github readme

注意:Stable-Baselines 支持 1.8.0 到 1.14.0 的 Tensorflow 版本。计划支持 Tensorflow 2 API。

同样的 github readme 也建议使用stable-baselines3,因为stable-baselines目前仅在维护中,其功能尚未扩展。因此,我预计不会TF1 -> TF2很快更新。

如果您无法安装此版本的tensorflow,我建议使用stable-baselines3并遵循示例。您上面发布的代码与文档不一致stable-baselines3,文档导入了MlpPolicyas

from stable_baselines3.sac.policies import MlpPolicy
Run Code Online (Sandbox Code Playgroud)