Batch size 指的是监督学习中神经工作训练的样本数量,然而,在强化学习的背景下,batch size 的含义是什么?它也指样品吗?如果是这样,样本在强化学习背景下的意义是什么?
reinforcement-learning batchsize
batchsize ×1
reinforcement-learning ×1