微调与再培训

Question

所以我正在学习如何使用Tensorflow来微调自定义数据集的Inception-v3模型.

我在虚拟机上完成了第一次再培训教程,只用了2-3个小时就完成了.对于相同的花朵数据集,我正在GPU上进行第二次微调教程,并且花了大约一整天来执行培训.

再培训和微调有什么区别？

我的印象是,两人都使用预先训练过的Inception v3模型,删除旧的顶层并在花卉照片上训练一个新的顶层.但我的理解可能是错的.

Answer 1

通常在ML文献中我们称之为微调过程:

这允许从特征提取层权重的良好配置开始,从而在短时间内达到最佳值.

您可以考虑使用精确调整,就像使用非常好的初始化方法为您的权重启动新火车一样(尽管您必须初始化新的分类层).

相反,当我们谈论模型的再培训时,我们通常会参考以下过程:

在这种情况下,您不是从上面的良好起点开始,而是从解决方案空间中的随机点开始.

这意味着您必须长时间训练模型,因为初始解决方案不如预训练模型为您提供的初始解决方案好.