稳定基线3模型中基于 LSTM 的策略

Ami*_*adi 5 reinforcement-learning stable-baselines

我正在尝试使用 stable-baselines3 库制作 PPO 模型。我想使用一个带有 LSTM 层的策略网络。然而,我在图书馆的网站上找不到这种可能性,尽管它存在于以前版本的 stable-baselines 中:https://stable-baselines.readthedocs.io/en/master/modules/policies.html#stable_baselines。 common.policies.MlpLstmPolicy

在 stable-baselines3(不是 stable-baselines)中是否存在这种可能性?如果没有,我还有其他可能做到这一点吗?谢谢。

bny*_*nye 3

来自迁移文档。

\n

https://stable-baselines3.readthedocs.io/en/master/guide/migration.html

\n
\n

重大更改\xc2\xb6

\n

LSTM 策略 ( MlpLstmPolicy,CnnLstmPolicy暂时不支持

\n
\n