稳定基线3模型中基于 LSTM 的策略

Ami*_*adi 5 reinforcement-learning stable-baselines

我正在尝试使用 stable-baselines3 库制作 PPO 模型。我想使用一个带有 LSTM 层的策略网络。然而，我在图书馆的网站上找不到这种可能性，尽管它存在于以前版本的 stable-baselines 中：https://stable-baselines.readthedocs.io/en/master/modules/policies.html#stable_baselines。 common.policies.MlpLstmPolicy。

在 stable-baselines3（不是 stable-baselines）中是否存在这种可能性？如果没有，我还有其他可能做到这一点吗？谢谢。

来自迁移文档。

\n

https://stable-baselines3.readthedocs.io/en/master/guide/migration.html

\n

\n
重大更改\xc2\xb6
\n
LSTM 策略 ( MlpLstmPolicy,CnnLstmPolicy暂时不支持
\n

\n

归档时间：	3 年，10 月前
查看次数：	6094 次
最近记录：	3 年，5 月前

值迭代和策略迭代之间有什么区别？ 65

如何使用Keras手动更新权重 8

PyTorch 多处理：访问共享模型时是否需要使用 Lock()？ 7

Cartpole-v0 的 PyTorch PPO 实现陷入局部最优 6

使用强化学习进行分类问题 5

为什么 q_net 有这么多的输入层？ 5

A3C和PPO在强化学习策略梯度方法上有什么相似之处？ 3

当动作不影响强化学习中的状态时，它叫什么？ 2

强化学习还是监督学习？ 1

安装稳定基线的正确方法？ 0

如何将Git存储库还原为以前的提交 7278

RESTful编程究竟是什么？ 3917

如何确定最初克隆本地Git存储库的URL？ 3782

在Python中查找包含它的列表的项目的索引 2887

如何在JavaScript中检查empty/undefined/null字符串？ 2645

迭代对象属性 1904

编译用于高放射性环境的应用程序 1414

Git:如何在项目提交历史中找到已删除的文件？ 1183

如何重置MySQL中的AUTO_INCREMENT？ 1174

如何从Python字符串中修剪空格？ 1103