python - 使用 Keras 微调 ResNet50 - val

python - 使用 Keras 微调 ResNet50 - val_loss 不断增加

转载作者：太空宇宙更新时间：2023-11-04 04:36:39

26

4

我正在尝试使用带有 tensorflow 后端的 keras 自定义 resnet50。然而，在训练后，我的 val_loss 不断增加。尝试不同的学习率和批量大小并不能解决问题。

使用不同的预处理方法，例如重新缩放或在 ImageDataGenerator 中使用 resnet50 的 preprocess_input 函数也没有解决问题。

这是我使用的代码

导入和预处理数据:

from keras.preprocessing.image import ImageDataGenerator
from keras.applications.resnet50 import preprocess_input, decode_predictions

IMAGE_SIZE = 224
BATCH_SIZE = 32

num_classes = 27

main_path = "C:/Users/aaron/Desktop/DATEN/data"

gesamt_path = os.path.join(main_path, "ML_DATA")
labels = listdir(gesamt_path)

data_generator = ImageDataGenerator(#rescale=1./255, 
                                    validation_split=0.20,
                                   preprocessing_function=preprocess_input)

train_generator = data_generator.flow_from_directory(gesamt_path, target_size=(IMAGE_SIZE, IMAGE_SIZE), shuffle=True, seed=13,
                                                     class_mode='categorical', batch_size=BATCH_SIZE, subset="training")

validation_generator = data_generator.flow_from_directory(gesamt_path, target_size=(IMAGE_SIZE, IMAGE_SIZE), shuffle=False, seed=13,
                                                     class_mode='categorical', batch_size=BATCH_SIZE, subset="validation")

定义和训练模型

img_width = 224
img_height = 224 

model = keras.applications.resnet50.ResNet50()

classes = list(iter(train_generator.class_indices))
model.layers.pop()
for layer in model.layers:
    layer.trainable=False
last = model.layers[-1].output
x = Dense(len(classes), activation="softmax")(last)
finetuned_model = Model(model.input, x)
finetuned_model.compile(optimizer=Adam(lr=0.001), loss='categorical_crossentropy', metrics=['accuracy'])
for c in train_generator.class_indices:
    classes[train_generator.class_indices[c]] = c
finetuned_model.classes = classes



earlystopCallback = keras.callbacks.EarlyStopping(monitor='val_loss', min_delta=0, patience=8, verbose=1, mode='auto')
tbCallBack = keras.callbacks.TensorBoard(log_dir='./Graph', histogram_freq=0, write_graph=True, write_images=True)

history = finetuned_model.fit_generator(train_generator,
                    validation_data=validation_generator, 
                    epochs=85, verbose=1,callbacks=[tbCallBack,earlystopCallback])

最佳答案

您需要匹配用于预训练网络的预处理，而不是自己的预处理。仔细检查网络输入张量，即输入的 channel 平均值是否与用于预训练网络的数据相匹配。
您的新数据可能与用于预训练网络的数据有很大不同。在这种情况下，所有 BN 层都会将其预训练的均值/方差迁移到新值，因此增加损失也是可能的(但最终损失应该会减少)。

关于python - 使用 Keras 微调 ResNet50 - val_loss 不断增加，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51544407/

26

4

0

文章推荐： python - h2o4gpu 是否处理像 sklearn 或 h2o 这样的分类特征？

文章推荐： html - jQuery Mobile 添加自定义图标到列表菜单

文章推荐： python - 我在更新 pip 以安装 python 包时遇到问题

iphone - 如何准备应用程序以提交到应用程序商店？我*不断*收到代码签名错误？
如果这不是一个错误，那就是另一个错误。如果不是那样的话，那就是别的东西了。我觉得我的项目已经改变了很多，现在只是试图解决代码签名问题，结果一切都搞砸了。我严格按照说明进行操作，但出现错误，例如当前的“
c++ - 我的 makefile 不断 self 编译；我究竟做错了什么？
我不确定是否有一些我不知道的内置变量或规则，或者 make 是否有问题，或者我只是疯了。对于我的一个项目，我有一个如下的 makefile: CC=g++ CFLAGS=-O3 `libpng-co
jQuery/CSS3 - 不断 3d 翻转 5 div？
我有大约 10 个 div，它们必须不断翻转，每个 div 延迟 3 秒这个 codrops 链接的最后一个效果是我正在寻找的，但无需单击 div http://tympanus.net/Devel
php - jQuery 不断 ping 以获取 Ajax 响应
我如何使用 jQuery 持续运行 PHP 脚本并每秒获取响应，以及将鼠标上的少量数据发送到同一脚本？我真的必须添加一些随机扩展才能让这么简单的计时器工作吗？最佳答案 To iterate is
java - REQUIRES_NEW 内的 REQUIRES_NEW 内的 REQUIRES_NEW ... 不断
JBoss 4.x EJB 3.0 我见过如下代码(大大简化): @Stateless @TransactionAttribute(TransactionAttributeType.NOT_SUPPO
git - 不能忽略 .idea/workspace.xml - 不断 pop
使用 PHPStorm，我试图忽略每次尝试进行 git 提交时 pop 的 workspace.xml。我的 .gitignore 看起来像: /.idea/ .idea/workspace.xml

首页

博学

6Ren·AI

商城

python - 使用 Keras 微调 ResNet50 - val_loss 不断增加