如何使用tensorflow.Estimator进行强化学习

Question

这tensorflow.Estimator似乎与监督学习有关,但即使模型或培训只需要进行小的改动,似乎很难采用其他任务.例如,在强化学习中,我需要提供一个奖励值,而这个值不属于features.

Answer 1

估计器是为传统的监督学习而设计的。因此，将它们用于强化学习可能会感到尴尬。这是一个可能有用的 RL 库： https: //github.com/tensorflow/agents。