如何使用tensorflow.Estimator进行强化学习

ted*_*ddy 5 tensorflow tensorflow-estimator

tensorflow.Estimator似乎与监督学习有关,但即使模型或培训只需要进行小的改动,似乎很难采用其他任务.例如,在强化学习中,我需要提供一个奖励值,而这个值不属于features.

iga*_*iga 2

估计器是为传统的监督学习而设计的。因此,将它们用于强化学习可能会感到尴尬。这是一个可能有用的 RL 库: https: //github.com/tensorflow/agents