Caffe快照:.solverstate与.caffemodel

mar*_*man 9 deep-learning caffe

在训练网络时,每N次迭代拍摄的快照有两种形式.一个是.solverstate文件,我认为它正是它听起来的样子,存储损失函数和渐变的状态等.另一个是.caffemodel文件,我知道存储训练的参数.

如果您需要预先训练的模型,.caffemodel是您需要的文件,所以我想如果您要测试网络,它也是您想要的文件.

WWhat是.solverstate的好处?在本教程中,您似乎可以从中重新开始训练,但这与使用.caffemodel有何不同?.solverstate也包含与.caffemodel相同的信息吗?换句话说,.caffemodel只是.solverstate的一个子集?

Har*_*han 5

solverstate文件,如其名称所传达的,存储解算器的状态,而不是与分类结果相关的任何信息.该模型保存为caffemodel文件,您可以使用该文件获取数据的分类结果.如果您想微调网络,可以使用预先训练好的caffemodel文件.这样可以节省时间,因为您的网络无需从头学习.但是,如果由于停电或意外重启而需要暂停您当前的培训,您可以从先前的solverstate快照恢复您的培训.使用solverstate和caffemodel文件之间的区别在于前者允许您以预先确定的方式完成训练,而后者可能需要更改某些训练参数,例如最大迭代次数.