gpt4 book ai didi

python - Keras:改变训练模型的结构

转载 作者:行者123 更新时间:2023-12-03 17:23:37 26 4
gpt4 key购买 nike

我是机器学习的新手。我通过给自己练习使用 Keras 来学习它。
Here is the video从我最近的练习中。我训练了一个卷积神经网络来识别三个不同的对象。手机将图像发送到我桌面上运行 Keras 的 Web 服务器。
我花了一段时间才得到一个有效的模型。我首先在无菌背景下对这 3 个对象的视频帧进行训练。我不知道这种技术是否有一个公认的名称,但我使用了一种“训练轮”方法。首先,我在一个非常简单的背景下训练了模型。然后在更繁忙的背景上拍摄了更多视频。我做了 6 轮,每轮都有不同的背景。在每一轮中,我加载了前几轮的权重,并在前几轮的组合数据集上训练了网络。这个想法是让神经网络从简单的事情开始,然后逐渐扩展它的知识,而不是试图马上给它一个困难的任务。
这似乎奏效了,我现在在不同背景上识别这些物体时有很好的准确性。我已将模型权重保存到文件中。
我的问题是:既然我有很好的训练有素的网络,是否可以改变它的结构?例如,现在我正在裁剪图像并将其大小调整为 64x64。如果我想把它提高到 128x128,我可以使用我目前训练过的重量吗?如果我想添加颜色(所以 3 个 channel 而不是 1 个)怎么办,是否可以不从头开始训练?

最佳答案

稍微了解一下神经网络。
神经网络架构的第一层学习简单的特征。
例如
考虑图像,第一层将学习检测水平或垂直边缘,稍后它将能够检测更复杂的特征。看看thisthis .
现在,你有一个训练有素的神经网络,并且你想要使用这些训练有素的权重,但同时改变架构。
保持模型顶部不变并改变底层架构:
如果您保持顶层不变并更改较低层的体系结构,则此方法将起作用。 IE。添加/删除密集层,添加/删除卷积层。
这是因为上一层学习的特征负责下一层的特征。看看this .如果您更改第一层中的神经元数量,则特征表示在随后的层中会发生变化。
因此,如果您在现有层中添加另一个卷积层,它将采用从训练模型生成的特征,并使用这些特征来学习更复杂的特征。
现在,如果您想保持模型的顶部不变,则必须使用与模型训练相同的输入格式。
换部门:
当您更改输入时,参数的数量以及可以处理该特定输入的层的类型会发生变化。

model = tf.keras.models.Sequential([
tf.keras.layers.Conv2D(3, 3,input_shape=(64,64,1)),
tf.keras.layers.Dense(512, activation=tf.nn.relu),
tf.keras.layers.Dense(10, activation=tf.nn.softmax)
])
model.summary()
输出:
Model: "sequential_5"
_________________________________________________________________
Layer (type) Output Shape Param #
=================================================================
conv2d_5 (Conv2D) (None, 62, 62, 3) 30
_________________________________________________________________
dense_10 (Dense) (None, 62, 62, 512) 2048
_________________________________________________________________
dense_11 (Dense) (None, 62, 62, 10) 5130
=================================================================
Total params: 7,208
Trainable params: 7,208
Non-trainable params: 0
代码:
model = tf.keras.models.Sequential([
tf.keras.layers.Conv2D(3, 3,input_shape=(64,64,3)),
tf.keras.layers.Dense(512, activation=tf.nn.relu),
tf.keras.layers.Dense(10, activation=tf.nn.softmax)
])
model.summary()
输出:
Model: "sequential_6"
_________________________________________________________________
Layer (type) Output Shape Param #
=================================================================
conv2d_6 (Conv2D) (None, 62, 62, 3) 84
_________________________________________________________________
dense_12 (Dense) (None, 62, 62, 512) 2048
_________________________________________________________________
dense_13 (Dense) (None, 62, 62, 10) 5130
=================================================================
Total params: 7,262
Trainable params: 7,262
Non-trainable params: 0
如您所见,两种模型的参数都不同。因此,您将无法将一个模型的权重用于您的第二个模型,因为权重矩阵的尺寸不匹配。
更改输入大小:
如果您更改输入大小而不更改 channel 数,即。 (64,64,1) --> (128, 128, 1) 您的参数将保持不变。因此,您可以将先前训练的权重与新模型一起使用。
但是,要知道学习的权重取决于输入的大小。因此,对 (64,64,1) 有效的方法不一定适用于 (128,128,1),但可以作为良好的初始化权重。
在经过训练的架构之前添加未经训练的层:
这是行不通的,因为正如我们之前看到的,前一层生成的特征负责下一层的特征。如果前一层的特征发生变化,那么下一层的特征也应该相应地发生变化。
关键点:
  • 如果您想使用预训练模型,请将模型保留为新架构的顶部,并使用与训练预训练模型相同的输入结构。
  • 如果你想改变 channel 的数量,你最好从头开始训练你的模型。
  • 如果要更改输入大小,可以使用预训练的模型权重作为一个很好的起点。
  • 关于python - Keras:改变训练模型的结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63659585/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com