Keras:使用更大的训练集更新模型

eri*_*k.b 5 python keras tensorflow

我使用训练集和Keras一起训练了一个用于文本分类(监督学习)的模型。假设此训练集中有50.000个句子。

在一周内,我收集了5.000个新句子,并将它们添加到旧的训练集中。

如果下周我想用新的更大的训练集(50.000个旧句子+ 5.000个新句子)来训练新模型,我应该从头开始重新开始训练阶段,还是可以采用旧模型并在其中“更新”它一些节省时间的方法?

Din*_*ari 1

您可以保存/加载模型/权重。查看Jason Brownlee 的教程。

加载权重后,您可以开始使用新数据集(55000 个样本)进行训练。由于“训练”基本上只是更新权重,并且您加载了经过训练的权重,因此您现在正在“更新”已经训练的模型。

  • 假设您使用词袋表示,您可以加载整个模型,并仅切换输入层。这样,除了第一个重量之外,您将保留所有训练过的重量。您可以在这里查找实现方法:/sf/ask/3468284571/ (2认同)