ted*_*ddy 5 tensorflow tensorflow-estimator
这tensorflow.Estimator似乎与监督学习有关,但即使模型或培训只需要进行小的改动,似乎很难采用其他任务.例如,在强化学习中,我需要提供一个奖励值,而这个值不属于features.
tensorflow.Estimator
features
iga*_*iga 2
估计器是为传统的监督学习而设计的。因此,将它们用于强化学习可能会感到尴尬。这是一个可能有用的 RL 库: https: //github.com/tensorflow/agents。
归档时间:
7 年,10 月 前
查看次数:
492 次
最近记录:
7 年,5 月 前