python - CNN 训练精度在训练期间变得更好，但测试精度保持在 40% 左右-6ren

python - CNN 训练精度在训练期间变得更好，但测试精度保持在 40% 左右

转载作者：太空宇宙更新时间：2023-11-03 14:01:37

所以在过去的几个月里，我一直在使用 Tensorflow 和 Keras 学习很多关于神经网络的知识，所以我想尝试为 CIFAR10 数据集(代码如下)制作一个模型。

然而，在训练过程中，准确率变得更好(从 1 个 epoch 后的约 35% 到 5 个 epoch 后的约 60-65%)，但 val_acc 保持不变或仅增加一点点。以下是打印结果:

Epoch 1/5
50000/50000 [==============================] - 454s 9ms/step - loss: 1.7761 - acc: 0.3584 - val_loss: 8.6776 - val_acc: 0.4489
Epoch 2/5
50000/50000 [==============================] - 452s 9ms/step - loss: 1.3670 - acc: 0.5131 - val_loss: 8.9749 - val_acc: 0.4365
Epoch 3/5
50000/50000 [==============================] - 451s 9ms/step - loss: 1.2089 - acc: 0.5721 - val_loss: 7.7254 - val_acc: 0.5118
Epoch 4/5
50000/50000 [==============================] - 452s 9ms/step - loss: 1.1140 - acc: 0.6080 - val_loss: 7.9587 - val_acc: 0.4997
Epoch 5/5
50000/50000 [==============================] - 452s 9ms/step - loss: 1.0306 - acc: 0.6385 - val_loss: 7.4351 - val_acc: 0.5321
10000/10000 [==============================] - 27s 3ms/step
loss:  7.435152648162842 
accuracy:  0.5321

我在互联网上四处查看，我最好的猜测是我的模型过度拟合，所以我尝试删除一些层，添加更多的 dropout 层并减少过滤器的数量，但没有显示出任何增强。

最奇怪的是，前段时间我根据一些教程做了一个非常相似的模型，在 8 个 epoch 后最终准确率达到了 80%。 (虽然我丢失了那个文件)

这是我的模型的代码:

model = Sequential()
model.add(Conv2D(filters=256,
                 kernel_size=(3, 3),
                 activation='relu',
                 data_format='channels_last',
                 input_shape=(32, 32, 3)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(filters=128,
                 kernel_size=(2, 2),
                 activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Flatten())
model.add(Dense(1024, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(10, activation='softmax'))


model.compile(optimizer=adam(),
              loss=categorical_crossentropy,
              metrics=['accuracy'])

model.fit(train_images, train_labels,
          batch_size=1000,
          epochs=5,
          verbose=1,
          validation_data=(test_images, test_labels))

loss, accuracy = model.evaluate(test_images, test_labels)
print('loss: ', loss, '\naccuracy: ', accuracy)

train_images 和 test_images 是 numpy 数组，大小为 (50000,32,32,3) 和 (10000,32,32,3) 和 train_labels 和 test_labels 是大小为 (50000 ,10) 和 (10000,10)。

我的问题:是什么原因造成的，我该怎么办？

根据 Maxim 的回答进行编辑:

我把模型改成这样:

model = Sequential()
model.add(Conv2D(filters=64,
                 kernel_size=(3, 3),
                 activation='relu',
                 kernel_initializer='he_normal',    # better for relu based networks
                 input_shape=(32, 32, 3)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(filters=256,
                 kernel_size=(3, 3),
                 activation='relu',
                 kernel_initializer='he_normal'))
model.add(MaxPooling2D((2, 2)))
model.add(Flatten())
model.add(Dense(512, activation='relu'))
model.add(Dropout(0.3))
model.add(Dense(10, activation='softmax'))

现在输出是这样的:

Epoch 1/10
50000/50000 [==============================] - 326s 7ms/step - loss: 1.4916 - acc: 0.4809 - val_loss: 7.7175 - val_acc: 0.5134
Epoch 2/10
50000/50000 [==============================] - 338s 7ms/step - loss: 1.0622 - acc: 0.6265 - val_loss: 6.9945 - val_acc: 0.5588
Epoch 3/10
50000/50000 [==============================] - 326s 7ms/step - loss: 0.8957 - acc: 0.6892 - val_loss: 6.6270 - val_acc: 0.5833
Epoch 4/10
50000/50000 [==============================] - 324s 6ms/step - loss: 0.7813 - acc: 0.7271 - val_loss: 5.5790 - val_acc: 0.6474
Epoch 5/10
50000/50000 [==============================] - 327s 7ms/step - loss: 0.6690 - acc: 0.7668 - val_loss: 5.7479 - val_acc: 0.6358
Epoch 6/10
50000/50000 [==============================] - 320s 6ms/step - loss: 0.5671 - acc: 0.8031 - val_loss: 5.8720 - val_acc: 0.6302
Epoch 7/10
50000/50000 [==============================] - 328s 7ms/step - loss: 0.4865 - acc: 0.8319 - val_loss: 5.6320 - val_acc: 0.6451
Epoch 8/10
50000/50000 [==============================] - 320s 6ms/step - loss: 0.3995 - acc: 0.8611 - val_loss: 5.3879 - val_acc: 0.6615
Epoch 9/10
50000/50000 [==============================] - 320s 6ms/step - loss: 0.3337 - acc: 0.8837 - val_loss: 5.6874 - val_acc: 0.6432
Epoch 10/10
50000/50000 [==============================] - 320s 6ms/step - loss: 0.2806 - acc: 0.9033 - val_loss: 5.7424 - val_acc: 0.6399
10000/10000 [==============================] - 19s 2ms/step
loss:  5.74234927444458 
accuracy:  0.6399

似乎我又过拟合了，尽管我在迄今为止获得的帮助下更改了模型...有任何解释或提示吗？

输入图像是 (32,32,3) numpy 数组，归一化为 (0,1)

最佳答案

您还没有包括如何准备数据，这是使该网络学习得更好的一项补充:

x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
x_train /= 255
x_test /= 255

如果您像那样进行数据归一化，那么您的网络就没问题:它在 5 个 epoch 后达到 ~65-70% 的测试准确率，这是一个很好的结果。请注意，5 个 epoch 只是一个开始，需要大约 30-50 个 epoch 才能真正很好地学习数据并显示接近最先进的结果。

以下是我注意到的一些小改进，可以让您获得额外的性能点数:

由于您使用的是基于 ReLu 的网络，he_normal 初始化器 is better比 glorot_uniform(这是 Conv2D 中的默认设置)。
随着网络的深入，减少过滤器的数量是很奇怪的。你应该反其道而行之。我更改了 256 -> 64 和 128 -> 256 并提高了准确性。
我稍微降低了 dropout 0.5 -> 0.4。
内核大小 3x3 比 2x2 更常见。我认为你也应该在第二个转换层上尝试一下。事实上，你可以玩all hyper-parameters找到最佳组合。

这是最终代码:

(x_train, y_train), (x_test, y_test) = cifar10.load_data()
print('x_train shape:', x_train.shape)
print(x_train.shape[0], 'train samples')
print(x_test.shape[0], 'test samples')

y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

model = Sequential()
model.add(Conv2D(filters=64,
                 kernel_size=(3, 3),
                 activation='relu',
                 kernel_initializer='he_normal',
                 input_shape=(32, 32, 3)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(filters=256,
                 kernel_size=(2, 2),
                 kernel_initializer='he_normal',
                 activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Flatten())
model.add(Dense(1024, activation='relu'))
model.add(Dropout(0.4))
model.add(Dense(10, activation='softmax'))

model.compile(optimizer=adam(),
              loss=categorical_crossentropy,
              metrics=['accuracy'])

x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
x_train /= 255
x_test /= 255

model.fit(x_train, y_train,
          batch_size=500,
          epochs=5,
          verbose=1,
          validation_data=(x_test, y_test))

loss, accuracy = model.evaluate(x_test, y_test)
print('loss: ', loss, '\naccuracy: ', accuracy)

5个epoch后的结果:

loss:  0.822134458447 
accuracy:  0.7126

顺便说一句，您可能有兴趣将您的方法与 keras example CIFAR-10 conv net 进行比较.

关于python - CNN 训练精度在训练期间变得更好，但测试精度保持在 40% 左右，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48594888/

文章推荐： ssl - 将 CRL(证书吊销列表)url 添加到证书

文章推荐： c# - Xml Xsd 验证失败 (xs :anyType)

JavaScript 精度
关于这个话题已经说了很多，但是我找不到我的问题的确切答案。 JavaScript 无法准确表示 0.1 等小数，这是可以理解的。例如，由于乘法运算期间发生舍入误差，这是正确的: 0.1 * 3 ==
之字形打印 float 精度
在 zig 中，可以使用“{d}”以十进制表示法打印浮点值。这将自动以全精度打印该值。有没有办法指定位数？是针对每个值，还是作为某种全局设置？最佳答案这将限制小数点后的位数，四舍五入和零填充: f
减法时的 MATLAB 精度
我正在进行的项目需要高精度。减法时我遇到的问题在这里说明: >> 1-0.9999999999999999 ans = 1.1102e-16 >> 1-0.99999999999999999 ans
Fortran - 在运行时设置变量的种类/精度
是否可以使变量本身的精度成为将在运行时定义的变量？说，如果我尝试编译: SUBROUTINE FOO( VARIABLE, PRECISION_VALUE ) IMPLICI
sqlite - 纬度查询-精度
我正在查询 SQLite 数据库以获取纬度/经度详细信息。 SELECT * FROM tblMain where latitude > -33.866 and latitude 151.20
fortran - 使用下划线定义种类/精度
我一直使用下划线将整数定义为 Fortran 中的特定类型。下面是一段代码，用于演示 1_8 的含义，例如: program main implicit none integer(2)
python - 品脱有效数字，精度
我正在寻找一种方法来告诉 pint 要打印多少个有效数字。例如，当我输入以下内容时: import pint ureg = pint.UnitRegistry() print(3*ureg.m /9)
安卓 IMU 精度
我正在从事一个项目，目标是从山上追踪动物。在第一个实地考察季中，我们使用了 OpenTags 和经过校准的摄像头，虽然可以正常工作，但需要大量的处理/校准，而且至关重要的是，当系统出现问题时无法提供任
划分时的 Javascript 精度
在 JavaScript 中有没有一种方法可以确定一个数除以另一个数是否会得到整数？就像 18.4/0.002 给我们 9200，但是 18.4/0.1 给我们 183.99999999999997。
数学库的 Javascript 精度
我正在尝试使用 Big.js 在 javascript 中完成此计算 r = (a * b)/ sqrt( ( a*sin(θ) )^2 + ( b*cos(θ) )^2 ) 我也试过 math.js
ios - gl_FragCoord 精度
我有这个片段着色器代码，它在 iOS 模拟器(非视网膜)和 iPad2(非视网膜)之间显示不同: highp vec2 textCoord; textCoord.x = gl_Fr
c++ double /精度
这个问题在这里已经有了答案: C++ calculating more precise than double or long double (2 个答案) 关闭 6 年前。是否有任何浮点类型在小
java - 位运算符 - 精度
我似乎一直困惑的三个问题: 为什么代码是 x & ~077比这行代码 x & 0177700 更好。是因为精度损失较小吗？为什么此代码对于设置数字中的第 5 位不正确？ num = num + 0x
c - float 精度
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: Precision of Floating Point 我正在尝试使用一些 float 来计算概率，但我的最
c - float 精度
由于微 Controller 的精度，我定义了一个包含两个 float 比率的符号，而不是直接写结果。 #define INTERVAL (0.01F/0.499F) 代替 #defi
c - c语言搜索算法执行时间(精度)
我试图比较这 3 种搜索算法，起初我使用 time.h 库但没有任何反应，输出始终是 0.00000 秒。现在我试图在循环中使用一些计数器。但我在这里也有问题, 任何人都可以帮我处理代码吗？这是我的
c - printf() 精度
char buf[10]; int counter, x = 0; snprintf (buf, sizeof buf , "%.100d%n", x, &counter); printf("Coun
matlab:评估向量时的错误/精度
我注意到在评估向量时对我来说是不可预测的行为。直接执行它与在循环中进行索引似乎是完全不同的。谁能帮我解决这个问题？我知道可能在它如何进行每个操作中都有解释，所以我需要一些关于如何查找它的键多谢指教提
安卓 GPS 精度
我想在我的应用程序中使用精确的 gps 定位。所以我遵循了一个简单的教程(LocationManager 的基本用法，明确要求 GPS 提供商，要求更新 0 ms，0 m)并创建了一个应用程序。我对更
c++ - float 精度
float 在 1.0f 和 0.0f 之间有多少位精度，这样每个值都可以唯一表示？例如，如果第一个小数 float 不能表示 0.13f，答案就是 float 只有一位精度。最佳答案 std::

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - CNN 训练精度在训练期间变得更好，但测试精度保持在 40% 左右

根据 Maxim 的回答进行编辑: