Ami*_*adi 5 reinforcement-learning stable-baselines
我正在尝试使用 stable-baselines3 库制作 PPO 模型。我想使用一个带有 LSTM 层的策略网络。然而,我在图书馆的网站上找不到这种可能性,尽管它存在于以前版本的 stable-baselines 中:https://stable-baselines.readthedocs.io/en/master/modules/policies.html#stable_baselines。 common.policies.MlpLstmPolicy。
在 stable-baselines3(不是 stable-baselines)中是否存在这种可能性?如果没有,我还有其他可能做到这一点吗?谢谢。
来自迁移文档。
\nhttps://stable-baselines3.readthedocs.io/en/master/guide/migration.html
\n\n\n重大更改\xc2\xb6
\nLSTM 策略 (
\nMlpLstmPolicy,CnnLstmPolicy暂时不支持