gpt4 book ai didi

Keras: model实现固定部分layer,训练部分layer操作

转载 作者:qq735679552 更新时间:2022-09-29 22:32:09 25 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章Keras: model实现固定部分layer,训练部分layer操作由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

需求:Resnet50做调优训练,将最后分类数目由1000改为500.

问题:网上下载了resnet50_weights_tf_dim_ordering_tf_kernels_notop.h5,更改了Resnet50后,由于所有层均参加训练,导致训练速度慢。实际上只需要训练最后3层,前面的层都不需要训练.

解决办法:

①将模型拆分为两个模型,一个为前面的notop部分,一个为最后三层,然后利用model的trainable属性设置只有后一个model训练,最后将两个模型合并起来.

②不用拆分,遍历模型的所有层,将前面层的trainable设置为False即可。代码如下:

?
1
2
3
for layer in model.layers[: - 3 ]:
  print (layer.trainable)
  layer.trainable = False

注意事项:

①尽量不要这样:

layers.Conv2D(filters1, (1, 1), trainable=False)(input_tensor) 。

因为容易出错。。.

②加载notop参数时注意by_name=True. 。

补充知识:Keras关于训练冻结部分层 。

设置冻结层有两种方式.

(不推荐)是在搭建网络时,直接将某层的trainable设置为false,例如

layers.Conv2D(filters1, (1, 1), trainable=False)(input_tensor) 。

在网络搭建完成时,遍历model.layer,然后将layer.trainable设置为False

?
1
2
3
4
# 冻结网络倒数的3层
for layer in model.layers[: - 3 ]:
  print (layer.trainable)
  layer.trainable = False

也可以根据layer.name来确定哪些层需要冻结,例如冻结最后一层和RNN层:

?
1
2
3
4
for layer in model.layers:
  layerName = str (layer.name)
  if layerName.startswith( "RNN_" ) or layerName.startswith( "Final_" ):
  layer.trainable = False

可以在实例化之后将网络层的 trainable 属性设置为 True 或 False。为了使之生效,在修改 trainable 属性之后,需要在模型上调用 compile().

这是一个例子 。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
x = Input (shape = ( 32 ,))
layer = Dense( 32 )
layer.trainable = False
y = layer(x)
 
frozen_model = Model(x, y)
# 在下面的模型中,训练期间不会更新层的权重
frozen_model. compile (optimizer = 'rmsprop' , loss = 'mse' )
 
layer.trainable = True
trainable_model = Model(x, y)
# 使用这个模型,训练期间 `layer` 的权重将被更新
# (这也会影响上面的模型,因为它使用了同一个网络层实例)
trainable_model. compile (optimizer = 'rmsprop' , loss = 'mse' )
 
frozen_model.fit(data, labels) # 这不会更新 `layer` 的权重
trainable_model.fit(data, labels) # 这会更新 `layer` 的权重

在网络搭建时,可以考虑最后一个分类层命名和分类数量关联,这样当费雷数量方式变化时,model.load_weight(“weight.h5”,by_name=True)不会加载最后一层 。

以上这篇Keras: model实现固定部分layer,训练部分layer操作就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我.

原文链接:https://blog.csdn.net/SingingFisher/article/details/81093963 。

最后此篇关于Keras: model实现固定部分layer,训练部分layer操作的文章就讲到这里了,如果你想了解更多关于Keras: model实现固定部分layer,训练部分layer操作的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com