python - Keras 多输入模型损失直线下降，不训练-6ren

python - Keras 多输入模型损失直线下降，不训练

转载作者：太空宇宙更新时间：2023-11-04 06:40:26

25

4

在使用 keras 的多输入模型时，该模型根本不进行训练。准确率飙升到接近 100% 而损失直线下降，所以我认为数据生成有问题。

我使用的是多输入 keras 模型，具有同一对象的两个图像，只是旋转了。计划是通过它自己的 CNN 运行每个图像，然后连接两个展平层并对对象进行分类。

我使用找到的方法(此处)准备数据[ https://github.com/keras-team/keras/issues/8130] .图像位于不同的目录中，但具有相同的种子，它们可以正确加载。标签也是正确的，我通过查看 ImageDataGenerator 生成的文件名和目录进行了检查。

模型很简单，我不认为这是问题所在

def multiInput_model():
    #create model - custom

    input_1 = Input(shape=(img_width,img_height,1))
    input_2 = Input(shape=(img_width,img_height,1))   

    output_1 = Conv2D(32,(5,5), activation='relu')(input_1)
    output_1 = BatchNormalization()(output_1)
    output_1 = MaxPooling2D(pool_size=(2,2))(output_1)
    output_1 = Dropout(0.4)(output_1)
    output_1 = Flatten()(output_1)

    output_2 = Conv2D(32,(5,5), activation='relu')(input_2)
    output_2 = BatchNormalization()(output_2)
    output_2 = MaxPooling2D(pool_size=(2,2))(output_2)
    output_2 = Dropout(0.4)(output_2)
    output_2 = Flatten()(output_2)

    inputs = [input_1,input_2]
    outputs = [output_1,output_2]
    combine = concatenate(outputs)

    output = Dense(32,activation='relu')(combine)
    output = Dense(num_classes,activation='softmax')(output)


    model = Model(inputs,[output])


    model.compile(loss='categorical_crossentropy',
                 optimizer='RMSprop',metrics=['accuracy'])

    return model

图像生成器如下

def generate_generator_multiple(generator,dir1, dir2, batch_size, img_width,img_height,subset):
    genX1 = generator.flow_from_directory(dir1,
                                      color_mode='grayscale',
                                      target_size= 
                                      (img_width,img_height),
                                      batch_size=batch_size,
                                      class_mode='categorical',
                                      shuffle=False,
                                      subset=subset,
                                      seed=1)
                                      #Same seed for consistency.

    genX2 = generator.flow_from_directory(dir2,
                                      color_mode='grayscale',
                                      target_size= 
                                      (img_width,img_height),
                                      batch_size=batch_size,
                                      class_mode='categorical',
                                      shuffle=False,
                                      subset=subset,
                                      seed=1)
    while True:
        X1i = genX1.next()
        X2i = genX2.next()
        yield [X1i[0],X2i[0]],X1i[1]    #Yields both images and their mutual label



train_generator = 
generate_generator_multiple(generator=train_datagen,
                                          dir1=train_data_dirA,
                                          dir2=train_data_dirB,
                                          batch_size=batch_size,
                                          img_width=img_width,
                                          img_height=img_height,
                                          subset='training')

validation_generator =  
generate_generator_multiple(generator=train_datagen,
                                               dir1=train_data_dirA,
                                               dir2=train_data_dirB,
                                               batch_size=batch_size,
                                               img_width=img_width,
                                               img_height=img_height,
                                               subset='validation')

输出总是这样

20/20 [==============================] - 4s 183ms/step - loss: 0.1342 - acc: 0.9500 - val_loss: 1.1921e-07 - val_acc: 1.0000
Epoch 2/20
20/20 [==============================] - 0s 22ms/step - loss: 1.1921e-07 - acc: 1.0000 - val_loss: 8.0590 - val_acc: 0.5000
Epoch 3/20
20/20 [==============================] - 0s 22ms/step - loss: 1.1921e-07 - acc: 1.0000 - val_loss: 16.1181 - val_acc: 0.0000e+00
Epoch 4/20
20/20 [==============================] - 0s 22ms/step - loss: 8.0590 - acc: 0.5000 - val_loss: 16.1181 - val_acc: 0.0000e+00

编辑:好的，算法现在正在训练。准确性似乎在提高，但验证准确性停留在 0.111(即 1/9，这意味着网络只是在猜测图像的标签)。但是，训练准确度确实提高了，所以至少它是过度拟合的(目前)。

EDIT2:我手动编辑了目录，因此我不再使用子集。目录拆分如下

-dir1 -> train -> class1 -> img...
               -> class2 -> img...
                ....
               -> class9 -> img...
      -> validate -> class1 -> img...
                  -> class2 -> img...
                  ....
                  -> class9 -> img...

-dir2 -> train -> class1 -> img...
               -> class2 -> img...
                ....
               -> class9 -> img...
      -> validate -> class1 -> img...
                  -> class2 -> img...
                  ....
                  -> class9 -> img...

现在更有趣的一点是验证损失增加而训练损失减少。运行 4 个 epoch，结果如下

126/126 [==============================] - 92s 730ms/step - loss: 
1.7158 - acc: 0.6583 - val_loss: 4.4013 - val_acc: 0.1111
Epoch 2/20
126/126 [==============================] - 88s 698ms/step - loss: 
1.2179 - acc: 0.7859 - val_loss: 5.5854 - val_acc: 0.1111
Epoch 3/20
126/126 [==============================] - 88s 700ms/step - loss: 
0.9849 - acc: 0.8308 - val_loss: 6.2045 - val_acc: 0.1111
Epoch 4/20
126/126 [==============================] - 89s 705ms/step - loss: 
0.9357 - acc: 0.8513 - val_loss: 6.9400 - val_acc: 0.1111

更新已检查图像对和图像标签。图像的所有标签都是正确的。所有图像都正确配对。

最佳答案

低训练损失和高 val 损失通常指向过度拟合。

在这种情况下，可能是第一个转换层的输出太大而无法馈送到致密层，这会导致致密层内的巨大权重矩阵过拟合数据。

也许堆叠更多的 Conv2d + MaxPooling2d 层将减少输入到密集层的大小，这将导致神经网络中参数总量的减少，帮助您处理过拟合。

关于python - Keras 多输入模型损失直线下降，不训练，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54593663/

25

4

0

文章推荐： c - 在c中发送外来字符

文章推荐： Java:从HTML中提取所有资源链接

文章推荐： Java解析字符串输入

PHP循环通过GPX来计算轨道的总上升/下降
我想循环遍历 gpx 文件并计算总上升和下降。我有一个函数可以计算两组经纬度点之间的高程差异，我已经设置了 simplexml 来读取和循环遍历 gpx 文件 trkseg 点。问题是，这不准确(实
javascript - 比较两个玩家分数数组，看看谁在列表中上升/下降
我有两个在不同时间段拍摄的数组。如何通过将新玩家标记为上升来检查哪些玩家在列表中上升/下降？附言- 数组已经根据分数排序。 pastData:[ { playerName:'Jo
vb6 - 无论我的表单上的哪个控件是目标，我如何捕捉关键的上升/下降？
我想捕获 ctrl/alt/etc 键的起伏，无论表单上的哪个控件获取 keyup 或 keydown 事件。由于我的表单上有大约 100 个控件，如果我要为每个单独的控件添加代码，那将非常难看。我怎
r - R:如何检查向量是否正在上升/下降
vector1 = c(2, 2, 2, 2, 2, 2) vector2 = c(2, 2, 3, 3, 3, 3) vector3 = c(2, 2, 1, 2, 2, 2) 我想知道向量中的数字
rust - 借入时暂时值(value)下降
我不知道如何遵循编译器的建议:consider using a let binding to create a longer lived value。 Playground #![allow(unus
javascript - AngularJS $scope 下降
我希望有人能帮助我理解 AngularJS 中的 $scope 遇到的一个恼人的问题。请参阅下面我的代码中的注释: app.controller('MyController', function ($
elasticsearch - 几个月后 Elasticsearch 下降
我有一个 flex 搜索集群，其中有2个节点在2核CPU 8GB ram实例上运行。每个节点都传入了参数“ES_JAVA_OPTS = -Xms3g -Xmx3g”。我有4个索引，每个索引有2个分片和
r - 从局部最小值/最大值计算累积增长/下降
我正在学习 R(及其通过 quantmod lib 在交易任务中的应用)并定期浏览社区以从这里获得许多新知识和技巧。我对 R 的总体印象和特别是 quantmod lib 的印象 - 它很棒。在这一
ios - 一些绘制周期后 FPS 下降
当我们点击屏幕时，我正在绘制纹理正方形。我正在使用相同的纹理。在新 ios 设备中点击几次后，FPS 从 120 下降到 4 左右。每次手指点击时，我都会将点击的点以及纹理和纹理的大小传递给着色器。
java - 为什么我的 FPS 下降？
只有当对象被点击并且需要从列表中移除时它才会掉落。这是代码: if(event.type == TouchEvent.TOUCH_DOWN){ for(Bottle bottl
ios - SKLabelNodes 下降 fps
我有一个基于SpriteKit的小游戏。在这个游戏中，我使用了很多带有字母(或字母组合)的节点，用户可以四处移动来构建单词。这些节点基本上是带有 SKLabelNode 的 SKSpriteNod
css - 为什么 float 下降？
我有一个简单的CSS布局 wrapper header left-sidebar / main-content / right-sidebar footer 但我的主要内容似乎下降了(float dr
html - 在浏览器重新调整大小时，div 下降
在标题中，我给出了四个不同的部分，并使用 float 属性使所有内容都显示在一条水平线上。当我调整浏览器窗口大小时，最后一个 div 位于黑色边框线下方。如何解决。 http://jsfiddle
javascript - 调整页面大小时 div 下降
CSS: .desc{ text-align: center; color:#60A8D5; padding-top: 17px;
html - float Div 下降
这是一段简单的代码，但我为这个问题尝试过的解决方案都没有奏效。 #ONE { float: left; border: 1
ios - 使用重力使 SCNNode 下降？
我有一个 SceneKit 设置，其中有一个 Sphere 设置为 Dynamic body。我能够运行该应用程序并看到球体落在静态 body 地板上。我想做的是设置场景，这样 sfere 最初就
javascript - 未使用的属性(property)下降？
首先，我的类(class): export class FooBar { ... isFavorite: boolean = false; constructor() { this.isF
linux - 如何使所有传出的 RST 下降
我正在尝试删除所有端口上的所有传出 RST 和传入 RST。我正在使用 Debian Linux。我尝试了互联网上列出的所有可能的命令组合，但似乎没有任何效果。例如，我试过: iptables -A
rust - 借用时临时值(value)下降，但我不想租借
我正在做这样的事情: fn main() { //[1, 0, 0, 0, 99]; // return [2, 0, 0, 0, 99] //[2, 3, 0, 3, 99]; //
rust - if else 借入时临时值(value)下降
我正在使用 Rusqlite，它可以让你做这样的查询: statement.query_row(params!([1, 2, 3]), ...); params!()定义如下: macro_rules

首页

博学

6Ren·AI

商城

python - Keras 多输入模型损失直线下降，不训练