您能否建议一些稳定基线的替代方案,我可以用它来训练强化学习中的代理。
另外,我正在使用健身房迷你网格环境,所以请告诉我那些在这种环境中工作的人。
python tensorflow openai-gym stable-baselines
openai-gym ×1
python ×1
stable-baselines ×1
tensorflow ×1