python - 为什么 Keras 在 model.evaluate、model.predicts 和 model.fit 之间给我不同的结果？-6ren

python - 为什么 Keras 在 model.evaluate、model.predicts 和 model.fit 之间给我不同的结果？

转载作者：行者123 更新时间：2023-12-03 23:47:19

我正在使用基于 resnet50 的双输出模型进行项目。一个输出用于回归任务，第二个输出用于分类任务。

我的主要问题是关于模型评估。在训练期间，我在验证集的两个输出上都取得了不错的结果:
- 综合损失 = 0.32507268732786176
- 准确度 = 0.97375
- Val MSE:4.1454763

model.evaluate 在同一组上给了我以下结果:
- 综合损失 = 0.33064378452301024
- 准确度 = 0.976
- Val MSE = 1.2375486

model.predict 给了我完全不同的结果(我使用 scikit-learn 来计算指标):
- 准确度 = 0.45875
- Val MSE:43.555958365743805
这些最后的值在每次预测执行时都会发生变化。

我在 TF2.0 上工作。
这是我的代码:

valid_generator=datagen.flow_from_dataframe(dataframe=df, 
                                            directory=PATH, 
                                            x_col="X", 
                                            y_col=["yReg","yCls"],  
                                            class_mode="multi_output", 
                                            target_size=(IMG_SIZE, IMG_SIZE), 
                                            batch_size=batch_size,
                                            subset="validation",
                                            shuffle=False,
                                            workers = 0)
def generate_data_generator(generator, train=True):
    while True:
        Xi, yi = train_generator.next()
        y2 = []
        for e in yi[1]:
            y2.append(to_categorical(e, 7))
        y2 = np.array(y2)
        if train: # Augmentation for training only
            Xi = Xi.astype('uint8')
            Xi_aug = seq(images=Xi) # imgaug lib needs uint8
            Xi_aug = Xi_aug.astype('float32')
            Xi_aug = preprocess_input(Xi_aug) # resnet50 preprocessing
            yield Xi_aug, [yi[0], y2]
        else: # Validation
            yield preprocess_input(Xi), [yi[0], y2]


model.fit_generator(generator=generate_data_generator(train_generator, True),
    steps_per_epoch=STEP_SIZE_TRAIN,
    validation_data=generate_data_generator(valid_generator, False),
    validation_steps=STEP_SIZE_VALID,
    verbose=1, 
    epochs=50, 
    callbacks=[checkpoint, tfBoard],
    )

evalu = model.evaluate_generator(generate_data_generator(valid_generator, False), steps=STEP_SIZE_VALID)
print(model.metrics_names)
print(evalu)

preds = model.predict_generator(generate_data_generator(valid_generator, False), steps=STEP_SIZE_VALID, workers = 0)
labels = valid_generator.labels

print("MSE error:", me.mean_squared_error(labels[0], preds[0]))
print("Accuracy:", me.accuracy_score(labels[1], preds[1].argmax(axis=1)))

我究竟做错了什么？

谢谢您的帮助 !

最佳答案

您仅使用一个数据点计算准确度 labels[1], preds[1]而不是所有数据点。您需要考虑所有数据点来计算准确度，以便将结果与 model.evaluate_generator 进行比较。 .您还计算了 MSE在 labels[0], preds[0]数据点，但准确性在 labels[1], preds[1] 上数据点。考虑这两种情况下的所有数据点。

下面是一个二元分类的例子，我没有对验证数据做任何数据增强。您可以在没有增强的情况下构建验证生成器并设置 shuffle=False每次生成相同批次的数据，因此您将获得相同的结果 model.evaluate_generator和 model.predict_generator .

验证生成器 -

validation_image_generator = ImageDataGenerator(rescale=1./255) # Generator for our validation data

val_data_gen = validation_image_generator.flow_from_directory(batch_size=batch_size,
                                                              directory=validation_dir,
                                                              shuffle=False,
                                                              seed=10,
                                                              target_size=(IMG_HEIGHT, IMG_WIDTH),
                                                              class_mode='binary')

以下是所有匹配 的准确率结果——

model.fit_generator

history = model.fit_generator(
          train_data_gen,
          steps_per_epoch=total_train // batch_size,
          epochs=5,
          validation_data=val_data_gen,
          validation_steps=total_val // batch_size)

输出 -

Found 2000 images belonging to 2 classes.
Found 1000 images belonging to 2 classes.
Epoch 1/5
20/20 [==============================] - 27s 1s/step - loss: 0.8691 - accuracy: 0.4995 - val_loss: 0.6850 - val_accuracy: 0.5000
Epoch 2/5
20/20 [==============================] - 26s 1s/step - loss: 0.6909 - accuracy: 0.5145 - val_loss: 0.6880 - val_accuracy: 0.5000
Epoch 3/5
20/20 [==============================] - 26s 1s/step - loss: 0.6682 - accuracy: 0.5345 - val_loss: 0.6446 - val_accuracy: 0.6320
Epoch 4/5
20/20 [==============================] - 26s 1s/step - loss: 0.6245 - accuracy: 0.6180 - val_loss: 0.6214 - val_accuracy: 0.5920
Epoch 5/5
20/20 [==============================] - 27s 1s/step - loss: 0.5696 - accuracy: 0.6795 - val_loss: 0.6468 - val_accuracy: 0.6270

model.evaluate_generator

evalu = model.evaluate_generator(val_data_gen)
print(model.metrics_names)
print(evalu)

输出 -

['loss', 'accuracy']
[0.646793782711029, 0.6269999742507935]

model.predict_generator

from sklearn.metrics import mean_squared_error, accuracy_score
preds = model.predict_generator(val_data_gen)
y_pred = tf.where(preds<=0.5,0,1)

labels = val_data_gen.labels
y_true = labels

# confusion_matrix(y_true, y_pred)
print("Accuracy:", accuracy_score(y_true, y_pred))

输出 -

Accuracy: 0.627

完整代码供您引用 -

%tensorflow_version 2.x
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Conv2D, Flatten, Dropout, MaxPooling2D
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.optimizers import Adam

import os
import numpy as np
import matplotlib.pyplot as plt

_URL = 'https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip'

path_to_zip = tf.keras.utils.get_file('cats_and_dogs.zip', origin=_URL, extract=True)

PATH = os.path.join(os.path.dirname(path_to_zip), 'cats_and_dogs_filtered')

train_dir = os.path.join(PATH, 'train')
validation_dir = os.path.join(PATH, 'validation')

train_cats_dir = os.path.join(train_dir, 'cats')  # directory with our training cat pictures
train_dogs_dir = os.path.join(train_dir, 'dogs')  # directory with our training dog pictures
validation_cats_dir = os.path.join(validation_dir, 'cats')  # directory with our validation cat pictures
validation_dogs_dir = os.path.join(validation_dir, 'dogs')  # directory with our validation dog pictures

num_cats_tr = len(os.listdir(train_cats_dir))
num_dogs_tr = len(os.listdir(train_dogs_dir))

num_cats_val = len(os.listdir(validation_cats_dir))
num_dogs_val = len(os.listdir(validation_dogs_dir))

total_train = num_cats_tr + num_dogs_tr
total_val = num_cats_val + num_dogs_val

batch_size = 100
epochs = 5
IMG_HEIGHT = 150
IMG_WIDTH = 150

train_image_generator = ImageDataGenerator(rescale=1./255,brightness_range=[0.5,1.5]) # Generator for our training data
validation_image_generator = ImageDataGenerator(rescale=1./255) # Generator for our validation data

train_data_gen = train_image_generator.flow_from_directory(batch_size=batch_size,
                                                           directory=train_dir,
                                                           shuffle=True,
                                                           target_size=(IMG_HEIGHT, IMG_WIDTH),
                                                           class_mode='binary')

val_data_gen = validation_image_generator.flow_from_directory(batch_size=batch_size,
                                                              directory=validation_dir,
                                                              shuffle=False,
                                                              seed=10,
                                                              target_size=(IMG_HEIGHT, IMG_WIDTH),
                                                              class_mode='binary')

model = Sequential([
    Conv2D(16, 3, padding='same', activation='relu', input_shape=(IMG_HEIGHT, IMG_WIDTH ,3)),
    MaxPooling2D(),
    Conv2D(32, 3, padding='same', activation='relu'),
    MaxPooling2D(),
    Conv2D(64, 3, padding='same', activation='relu'),
    MaxPooling2D(),
    Flatten(),
    Dense(512, activation='relu'),
    Dense(1)
])

model.compile(optimizer="adam", 
          loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
          metrics=['accuracy'])

history = model.fit_generator(
          train_data_gen,
          steps_per_epoch=total_train // batch_size,
          epochs=epochs,
          validation_data=val_data_gen,
          validation_steps=total_val // batch_size)

evalu = model.evaluate_generator(val_data_gen, steps=total_val // batch_size)
print(model.metrics_names)
print(evalu)

from sklearn.metrics import mean_squared_error, accuracy_score
#val_data_gen.reset()
preds = model.predict_generator(val_data_gen, steps=total_val // batch_size)
y_pred = tf.where(preds<=0.5,0,1)

labels = val_data_gen.labels
y_true = labels

test_labels = []

for i in range(0,10):
    test_labels.extend(np.array(val_data_gen[i][1]))

# confusion_matrix(y_true, y_pred)
print("Accuracy:", accuracy_score(test_labels, y_pred))

还要记住， fit_generator , evaluate_generator和 predict_generator功能已弃用。它将在 future 版本中删除。更新说明:请分别使用支持生成器的Model.fit、Model.evaluate、Model.predict。

希望这能回答你的问题。快乐学习。

关于python - 为什么 Keras 在 model.evaluate、model.predicts 和 model.fit 之间给我不同的结果？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61851737/

文章推荐： c# - 带有聚合管道的 MongoDB C# 驱动程序更新文档

文章推荐： ansible - Molecule - 来自其他目录的测试角色

文章推荐： c - 自己编写的简单 memset 不适用于 ARMv7 上的 -03 eabi gcc

node.js - Mongoose.model vs Connection.model vs Model.model
我对 mongoosejs 中模型的使用感到有些困惑。可以通过这些方式使用 mongoose 创建模型使用 Mongoose var mongoose = require('mongoose');
python - models.py 中的 models.Model 参数到底指的是什么？
我正在看 from django.db import models class Publisher(models.Model): name = models.CharField(max_len
asp.net-mvc-2 - 为什么 model => model.Reason_ID 变成 model =>Convert(model.Reason_ID)
我有自己的 html 帮助器扩展，我用这种方式 model.Reason_ID, Register.PurchaseReason) %> 这样声明的。 public static MvcHtmlS
python - model.to(device) 和 model=model.to(device) 有什么区别？
假设模型原本是存储在CPU上的，然后我想把它移到GPU0上，那么我可以这样做: device = torch.device('cuda:0') model = model.to(device) # o
model-view-controller - MVC : Data Models and View Models
我过去读过一些关于模型的 MVC 建议，指出不应为域和 View 重用相同的模型对象；但我找不到任何人愿意讨论为什么这很糟糕。我认为创建两个单独的模型 - 一个用于域，一个用于 View - 然后在
model - 为什么 model.forward(input) 和 model(input) 之间有不同的输出
我正在使用pytorch构建一个像VGG16这样的简单模型，并且我已经重载了函数forward在我的模型中。我发现每个人都倾向于使用 model(input)得到输出而不是 model.forwar
python - tf.keras.models.model 与 tf.keras.model
tf.keras API 中的 models 是否多余？对于某些情况，即使不使用 models，代码也能正常运行。 keras.models.sequential 和 keras.sequential
docker - 运行docker容器报错: Could not find base path/models/model for servable model
当我尝试使用 docker 镜像运行 docker 容器时遇到问题:tensorflow/serving。我运行命令: docker run --name=tf_serving -it tensor
python - Model.get_model_path(model_name ="model") 抛出错误 : Model not found in cache or in root at
我有一个模型，我用管道注册了它: register_step = PythonScriptStep(name = "Register Model",
model-view-controller - MVC : pass model/model data to a view from a controller?
如果 View 需要访问模型中的数据，您是否认为 Controller 应: a)将模型传递给 View b)将模型的数据传递给 View c)都不；这不应该是 Controller 所关心的。让 V
python - Models.Model 的列表模型字段
我正在寻找一个可以在模型中定义的字段，该字段本质上是一个列表，因为它将用于存储多个字符串值。显然CharField不能使用。最佳答案您正在描述一种多对一的关系。这应该通过一个额外的 Model 进
python - Django + (django-model-utils) : Combining two models/inheriting from two models
我最近了解了 Django 中的模型继承。我使用很棒的包 django-model-utils 取得了巨大的成功。我继承自 TimeStampedModel 和 SoftDeletableModel。
python - 为什么 Keras 在 model.evaluate、model.predicts 和 model.fit 之间给我不同的结果？
我正在使用基于 resnet50 的双输出模型进行项目。一个输出用于回归任务，第二个输出用于分类任务。我的主要问题是关于模型评估。在训练期间，我在验证集的两个输出上都取得了不错的结果: - 综合损失
python - Keras:我可以使用 model.predict 但不使用 model.predict_generator 来预测是否使用 model.fit_generator 训练模型
我是keras的新手。现在，我将使用我使用 model.fit_generator 训练的模型来预测测试图像组。我可以使用 model.predict 吗？不确定如何使用model.predict_g
javascript - 将 Model.ID 绑定(bind)到复选框列表并将 Model.X、Model.Y 等属性发布到 Controller
在 MVC 应用程序中，我加入了多个表并将其从 Controller 返回到 View，如下所示: | EmployeeID | ControlID | DoorAddress | DoorID |
node.js - Cassandra Sails model.count() 有效但 model.find() 和 model.findOne() 无效
我在使用 sails-cassandra 连接系统的 Sails 中有一个 Data 模型。数据。 Data.count({...}).exec() 返回 1，但 Data.find({...}).e
java.lang.IllegalArgumentException : Cannot convert Model. User[ usrId=1 ] 将类 Model.User 键入类 Model.User
我正在使用 PrimeFaces dataTable 开发一个 jsf 页面来显示用户列表。用户存储在 Model.User 类的对象中。
python - Keras错误: Error when checking model target: the list of Numpy arrays that you are passing to your model is not the size the model expected
我正在关注https://www.tensorflow.org/tutorials/keras/basic_classification解决 Kaggle 挑战。但是，我不明白应该将什么样的数据输入
python - 如何使用 model.pb、model.h5 或 model.json 创建 CNN 的 .config 文件？
我是这个领域的新手。那么，你们能帮忙如何为 CNN 创建 .config 文件吗？传递有关如何执行此操作的文档或教程将对我有很大帮助。谢谢大家。最佳答案这个问题对我来说没有多大意义，因为 .co
modeling - 一致的术语 : Modeling, DAE、ODE
我是“物理系统建模”主题的新手。我阅读了一些基础文献，并在 Modelica 和 Simulink/Simscape 中做了一些教程。我想问你，如果我对以下内容理解正确: 符号操作是将微分代数方程组(

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 为什么 Keras 在 model.evaluate、model.predicts 和 model.fit 之间给我不同的结果？