gpt4 book ai didi

deep-learning - Caffe快照: . SolverState与.CaffeModel

转载 作者:行者123 更新时间:2023-12-04 04:16:11 26 4
gpt4 key购买 nike

训练网络时,每N次迭代拍摄的快照会以两种形式同时出现。一个是.solverstate文件,我想它就是听起来像的样子,它存储损失函数和梯度的状态,等等。另一个是.caffemodel文件,我知道该文件存储了经过训练的参数。

如果需要预训练的模型,.caffemodel是您需要的文件,因此我想如果要测试网络,它也是您想要的文件。

.solverstate有什么用?在this tutorial中,您似乎可以从中重新开始训练,但这与使用.caffemodel有何不同? .solverstate是否也包含与.caffemodel相同的信息?换句话说,.caffemodel只是.solverstate的子集吗?

最佳答案

顾名思义,solverstate文件存储的是求解器的状态,而不存储与分类结果有关的任何信息。该模型另存为caffemodel文件,可用于获取数据的分类结果。如果要微调网络,可以使用预先训练的caffemodel文件。这将节省时间,因为您的网络不需要从头开始学习。但是,如果由于停电或意外重启而需要停止当前的培训,则可以从求解器状态的先前快照继续进行培训。使用solverstate和caffemodel文件之间的区别在于,前者允许您以预定方式完成训练,而后者可能需要更改某些训练参数,例如最大迭代次数。

关于deep-learning - Caffe快照: . SolverState与.CaffeModel,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36504628/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com