在课程中没有关于 epoch 的内容,但在实践中它们无处不在。如果优化器在一次通过中找到最佳权重,为什么我们需要它们。为什么模型会改进?
machine-learning
machine-learning ×1