python - 我卡住了所有 keras 层，但使用 fit_generator 时模型发生了变化-6ren

python - 我卡住了所有 keras 层，但使用 fit_generator 时模型发生了变化

转载作者：行者123 更新时间：2023-11-28 17:18:21

我正在尝试使用微调方法重新训练模型。作为完整性检查，我尝试重新训练它，同时首先卡住它的所有层。我预计模型不会改变；我很惊讶地看到这个:

Epoch 1/50
16/16 [==============================] - 25s - loss: 4.0006 - acc: 0.5000 - val_loss: 1.3748e-04 - val_acc: 1.0000
Epoch 2/50
16/16 [==============================] - 24s - loss: 3.8861 - acc: 0.5000 - val_loss: 1.7333e-04 - val_acc: 1.0000
Epoch 3/50
16/16 [==============================] - 25s - loss: 3.9560 - acc: 0.5000 - val_loss: 3.0870e-04 - val_acc: 1.0000
Epoch 4/50
16/16 [==============================] - 26s - loss: 3.9730 - acc: 0.5000 - val_loss: 7.5931e-04 - val_acc: 1.0000
Epoch 5/50
16/16 [==============================] - 26s - loss: 3.7195 - acc: 0.5000 - val_loss: 0.0021 - val_acc: 1.0000
Epoch 6/50
16/16 [==============================] - 25s - loss: 3.9514 - acc: 0.5000 - val_loss: 0.0058 - val_acc: 1.0000
Epoch 7/50
16/16 [==============================] - 26s - loss: 3.9459 - acc: 0.5000 - val_loss: 0.0180 - val_acc: 1.0000
Epoch 8/50
16/16 [==============================] - 26s - loss: 3.8744 - acc: 0.5000 - val_loss: 0.0489 - val_acc: 1.0000
Epoch 9/50
16/16 [==============================] - 27s - loss: 3.8914 - acc: 0.5000 - val_loss: 0.1100 - val_acc: 1.0000
Epoch 10/50
16/16 [==============================] - 26s - loss: 4.0585 - acc: 0.5000 - val_loss: 0.2092 - val_acc: 0.7500
Epoch 11/50
16/16 [==============================] - 27s - loss: 4.0232 - acc: 0.5000 - val_loss: 0.3425 - val_acc: 0.7500
Epoch 12/50
16/16 [==============================] - 25s - loss: 3.9073 - acc: 0.5000 - val_loss: 0.4566 - val_acc: 0.7500
Epoch 13/50
16/16 [==============================] - 27s - loss: 4.1036 - acc: 0.5000 - val_loss: 0.5454 - val_acc: 0.7500
Epoch 14/50
16/16 [==============================] - 26s - loss: 3.7854 - acc: 0.5000 - val_loss: 0.6213 - val_acc: 0.7500
Epoch 15/50
16/16 [==============================] - 27s - loss: 3.7907 - acc: 0.5000 - val_loss: 0.7120 - val_acc: 0.7500
Epoch 16/50
16/16 [==============================] - 27s - loss: 4.0540 - acc: 0.5000 - val_loss: 0.7226 - val_acc: 0.7500
Epoch 17/50
16/16 [==============================] - 26s - loss: 3.8669 - acc: 0.5000 - val_loss: 0.8032 - val_acc: 0.7500
Epoch 18/50
16/16 [==============================] - 28s - loss: 3.9834 - acc: 0.5000 - val_loss: 0.9523 - val_acc: 0.7500
Epoch 19/50
16/16 [==============================] - 27s - loss: 3.9495 - acc: 0.5000 - val_loss: 2.5764 - val_acc: 0.6250
Epoch 20/50
16/16 [==============================] - 25s - loss: 3.7534 - acc: 0.5000 - val_loss: 3.0939 - val_acc: 0.6250
Epoch 21/50
16/16 [==============================] - 29s - loss: 3.8447 - acc: 0.5000 - val_loss: 3.0467 - val_acc: 0.6250
Epoch 22/50
16/16 [==============================] - 28s - loss: 4.0613 - acc: 0.5000 - val_loss: 3.2160 - val_acc: 0.6250
Epoch 23/50
16/16 [==============================] - 28s - loss: 4.1428 - acc: 0.5000 - val_loss: 3.8793 - val_acc: 0.6250
Epoch 24/50
16/16 [==============================] - 27s - loss: 3.7868 - acc: 0.5000 - val_loss: 4.1935 - val_acc: 0.6250
Epoch 25/50
16/16 [==============================] - 28s - loss: 3.8437 - acc: 0.5000 - val_loss: 4.5031 - val_acc: 0.6250
Epoch 26/50
16/16 [==============================] - 28s - loss: 3.9798 - acc: 0.5000 - val_loss: 4.5121 - val_acc: 0.6250
Epoch 27/50
16/16 [==============================] - 28s - loss: 3.8727 - acc: 0.5000 - val_loss: 4.5341 - val_acc: 0.6250
Epoch 28/50
16/16 [==============================] - 28s - loss: 3.8343 - acc: 0.5000 - val_loss: 4.5198 - val_acc: 0.6250
Epoch 29/50
16/16 [==============================] - 28s - loss: 4.2144 - acc: 0.5000 - val_loss: 4.5341 - val_acc: 0.6250
Epoch 30/50
16/16 [==============================] - 28s - loss: 3.8348 - acc: 0.5000 - val_loss: 4.5684 - val_acc: 0.6250

这是我使用的代码:

from keras import backend as K
import inception_v4
import numpy as np
import cv2
import os

import re

from keras import optimizers
from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Convolution2D, MaxPooling2D, ZeroPadding2D
from keras.layers import Activation, Dropout, Flatten, Dense, Input

from keras.models import Model
os.environ['CUDA_VISIBLE_DEVICES'] = ''


    

v4 = inception_v4.create_model(weights='imagenet')


#v4.summary()
my_batch_size=1
train_data_dir ='//shared_directory/projects/try_CDFxx/data/train/'
validation_data_dir ='//shared_directory/projects/try_CDFxx/data/validation/'
top_model_weights_path= 'bottleneck_fc_model.h5'
class_num=2

img_width, img_height = 299, 299
nbr_train_samples=16
nbr_validation_samples=8
num_classes=2
nb_epoch=50

main_input= v4.layers[1].input
main_output=v4.layers[-1].output
flatten_output= v4.layers[-2].output


BN_model = Model(input=[main_input], output=[main_output, flatten_output])





### DEF
train_datagen = ImageDataGenerator(
            rescale=1./255,
            shear_range=0.1,
            zoom_range=0.1,
            rotation_range=10.,
            width_shift_range=0.1,
            height_shift_range=0.1,
            horizontal_flip=True)

val_datagen = ImageDataGenerator(rescale=1./255)

    
    
train_generator = train_datagen.flow_from_directory(
            train_data_dir,
            target_size = (img_width, img_height),
            batch_size = my_batch_size,
            shuffle = True,
            class_mode = 'categorical')

validation_generator = val_datagen.flow_from_directory(
            validation_data_dir,
            target_size=(img_width, img_height),
            batch_size=my_batch_size,
            shuffle = True,
            class_mode = 'categorical') # sparse


###

def save_BN(BN_model):   # but we will need to get the get_processed_image into it!!!!
#   
    datagen = ImageDataGenerator(rescale=1./255) # here!
#   
    generator = datagen.flow_from_directory(
            train_data_dir,
            target_size=(img_width, img_height),
            batch_size=my_batch_size,
            class_mode='categorical',
            shuffle=False)
    nb_train_samples = generator.classes.size       
    bottleneck_features_train = BN_model.predict_generator(generator, nb_train_samples)
#
    np.save(open('bottleneck_flat_features_train.npy', 'wb'), bottleneck_features_train[1])

    np.save(open('bottleneck_train_labels.npy', 'wb'), generator.classes)
    #   generator is probably a tuple - and the second thing in it is a label! OKAY, its not :(
    generator = datagen.flow_from_directory(
            validation_data_dir,
            target_size=(img_width, img_height),
            batch_size=my_batch_size,
            class_mode='categorical',
            shuffle=False)
            
    nb_validation_samples = generator.classes.size
    bottleneck_features_validation = BN_model.predict_generator(generator, nb_validation_samples)
    #bottleneck_features_validation = model.train_generator(generator, nb_validation_samples)
#
    np.save(open('bottleneck_flat_features_validation.npy', 'wb'), bottleneck_features_validation[1])

    np.save(open('bottleneck_validation_labels.npy', 'wb'), generator.classes)
    
    

def train_top_model ():
    train_data = np.load(open('bottleneck_flat_features_train.npy'))
    train_labels = np.load(open('bottleneck_train_labels.npy'))
#
    validation_data = np.load(open('bottleneck_flat_features_validation.npy'))
    validation_labels = np.load(open('bottleneck_validation_labels.npy'))
    #
    top_m  = Sequential()
    top_m.add(Dense(class_num,input_shape=train_data.shape[1:], activation='softmax', name='top_dense1'))
    top_m.compile(optimizer='rmsprop', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
#
    top_m.fit(train_data, train_labels,
    nb_epoch=nb_epoch, batch_size=my_batch_size,
    validation_data=(validation_data, validation_labels))
#
#
    #top_m.save_weights (top_model_weights_path)
#   validation_data[0]
#   train_data[0]
    Dense_layer=top_m.layers[-1]
    top_layer_weights=Dense_layer.get_weights()
    np.save(open('retrained_top_layer_weight.npy', 'wb'), top_layer_weights)


def fine_tune_model (): 

    predictions = Flatten()(v4.layers[-3].output)
    predictions = Dense(output_dim=num_classes, activation='softmax', name="newDense")(predictions)
    main_input= v4.layers[1].input
    main_output=predictions
    FT_model = Model(input=[main_input], output=[main_output])

    top_layer_weights = np.load(open('retrained_top_layer_weight.npy'))
    Dense_layer=FT_model.layers[-1]
    Dense_layer.set_weights(top_layer_weights)
    
    for layer in FT_model.layers:
        layer.trainable = False 
#   FT_model.layers[-1].trainable=True

    FT_model.compile(optimizer=optimizers.SGD(lr=1e-4, momentum=0.9), loss='categorical_crossentropy', metrics=['accuracy'])

    
    FT_model.fit_generator(
            train_generator,
            samples_per_epoch = nbr_train_samples,
            nb_epoch = nb_epoch,
            validation_data = validation_generator,
            nb_val_samples = nbr_validation_samples)    

########################################################
            ###########


save_BN(BN_model)
train_top_model()

fine_tune_model()

谢谢。

附言我正在使用 keras 1。

最佳答案

您正在使用 dropout，因此指标可能因关闭不同的单元而在不同的运行中有所不同。

关于python - 我卡住了所有 keras 层，但使用 fit_generator 时模型发生了变化，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42875770/

文章推荐： python - 使用分区计算 Pandas 中条目之间的增量

文章推荐： html - 如何使用html和css绘制SVG图标？

文章推荐： python - 在树莓派上模拟 Gpio 输入进行测试

文章推荐： python - 在 TruncatedSVD Python 之后绘制 K-means 集群

keras - keras 和 tf.keras 模型之间的兼容性
我有兴趣在 tf.keras 中训练一个模型，然后用 keras 加载它。我知道这不是高度建议，但我对使用 tf.keras 来训练模型很感兴趣，因为 tf.keras 更容易构建输入管道我想利用
keras - Keras 中的自定义损失函数结合了多个输出
我进行了大量搜索，但仍然无法弄清楚如何编写具有多个交互输出的自定义损失函数。我有一个神经网络定义为: def NeuralNetwork(): inLayer = Input((2,));
keras - 差异学习率 - Keras
我正在阅读一篇名为 Differential Learning Rates 的文章在 Medium 上，想知道这是否可以应用于 Keras。我能够找到在 pytorch 中实现的这项技术。这可以在 K
keras - Keras 如何评估测试集上的损失？
我正在实现一个神经网络分类器，以打印我正在使用的这个神经网络的损失和准确性: score = model.evaluate(x_test, y_test, verbose=False) model.m
keras - keras 模型输出形状中的方括号
我最近在查看模型摘要时遇到了这个问题。我想知道，[(None, 16)] 和有什么区别？和 (None, 16) ?为什么输入层有这样的输入形状？来源:model.summary() can't
keras - Keras 中基于输入数据的自定义损失函数
我正在尝试使用 Keras 创建自定义损失函数。我想根据输入计算损失函数并预测神经网络的输出。我尝试在 Keras 中使用 customloss 函数。我认为 y_true 是我们为训练提供的输出，
keras - keras 中二维元素的填充序列
我有一组样本，每个样本都是一组属性的序列(例如，一个样本可以包含 10 个序列，每个序列具有 5 个属性)。属性的数量总是固定的，但序列的数量(时间戳)可能因样本而异。我想使用这个样本集在 Keras
keras - Keras 中的类数量错误
Keras 在训练集和测试集文件夹中发现了错误数量的类。我有 3 节课，但它一直说有 4 节课。有人可以帮我吗？这里的代码: cnn = Sequential() cnn.add(Conv2D(32
keras - keras 自定义层中的持久变量
我想编写一个自定义层，在其中我可以在两次运行之间将变量保存在内存中。例如， class MyLayer(Layer): def __init__(self, out_dim = 51, **kwarg
keras - Keras:如何将学习率输出到张量板上
我添加了一个回调来降低学习速度： keras.callbacks.ReduceLROnPlateau(monitor='val_loss', factor=0.5, patience=100,
keras - keras lstm层中的多个内核是什么意思？
在 https://keras.io/layers/recurrent/我看到 LSTM 层有一个 kernel和一个 recurrent_kernel .它们的含义是什么？根据我的理解，我们需要 L
keras - 如何检查安装了哪个版本的 Keras？
问题与标题相同。我不想打开 Python，而是使用 MacOS 或 Ubuntu。最佳答案 Python 库作者将版本号放入 .__version__ 。您可以通过在命令行上运行以下命令来打印它:
keras - Keras 中的嵌入是什么？
Keras 文档并不清楚这实际上是什么。我知道我们可以用它来将输入特征空间压缩成更小的空间。但从神经设计的角度来看，这是如何完成的呢？它是一个自动编码器，RBM吗？最佳答案据我所知，嵌入层是一个简
keras - Keras 的中心损失
我想实现[http://ydwen.github.io/papers/WenECCV16.pdf]中解释的中心损失]在喀拉斯我开始创建一个具有 2 个输出的网络，例如: inputs = Input
keras - keras 中的多对一实现
我正在尝试实现多对一模型，其中输入是大小为的词向量d .我需要输出一个大小为的向量d 在 LSTM 结束时。在此 question ，提到使用(对于多对一模型) model = Sequenti
keras - Keras 中验证集的不同损失函数
我有不平衡的训练数据集，这就是我构建自定义加权分类交叉熵损失函数的原因。但问题是我的验证集是平衡的，我想使用常规的分类交叉熵损失。那么我可以在 Keras 中为验证集传递不同的损失函数吗？我的意思是用
keras - Keras 中输入数据的规范化
DL 中的一项常见任务是将输入样本归一化为零均值和单位方差。可以使用如下代码“手动”执行规范化: mean = np.mean(X, axis = 0) std = np.std(X, axis =
keras - Keras 中回调和进度条的准确性不匹配
我正在尝试学习 Keras 并使用 LSTM 解决分类问题。我希望能够绘制准确率和损失，并在训练期间更新图。为此，我正在使用 callback function . 由于某种原因，我在回调中收到的准
keras - 嵌入 Keras
在 Keras 内置函数中嵌入使用哪种算法？Word2vec？手套？其他？ https://keras.io/layers/embeddings/ 最佳答案简短的回答是都不是。本质上，GloVe 的
keras - keras 中的渐变裁剪
我有一个使用 Keras 完全实现的 LSTM RNN，我想使用梯度剪裁，梯度范数限制为 5(我正在尝试复制一篇研究论文)。在实现神经网络方面，我是一个初学者，我将如何实现？是否只是(我正在使用 r

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 我卡住了所有 keras 层，但使用 fit_generator 时模型发生了变化