python - 防止 Predict_generator 打乱批处理-6ren

python - 防止 Predict_generator 打乱批处理

转载作者：太空宇宙更新时间：2023-11-03 21:39:27

25

4

我正在尝试检查我的模型在验证数据集上的性能。因此，我使用 predict_generator 从我的 validation_generator 返回预测。但是，我无法将预测与从 validation_generator.classes 返回的真实标签进行匹配，因为我的预测顺序混淆了。

这就是我初始化生成器的方式:

BATCH_SIZE = 64
data_generator = ImageDataGenerator(rescale=1./255, 
                                    validation_split=0.20)

train_generator = data_generator.flow_from_directory(main_path, target_size=(IMAGE_HEIGHT, IMAGE_SIZE), shuffle=False, seed=13,
                                                     class_mode='categorical', batch_size=BATCH_SIZE, subset="training")

validation_generator = data_generator.flow_from_directory(main_path, target_size=(IMAGE_HEIGHT, IMAGE_SIZE), shuffle=False, seed=13,
                                                     class_mode='categorical', batch_size=BATCH_SIZE, subset="validation")

#Found 4473 images belonging to 3 classes.
#Found 1116 images belonging to 3 classes.

现在我正在使用 Predict_generator，如下所示:

validation_steps_per_epoch = np.math.ceil(validation_generator.samples / validation_generator.batch_size)

predictions = model.predict_generator(validation_generator, steps=validation_steps_per_epoch)

我意识到我的验证数据大小(=1116)和validation_steps_per_epoch(=1152)之间不匹配。由于这两者不匹配，我发现每次运行 model.predict_generator(...) 时，输出预测都是不同的。

除了将batch_size更改为1以确保生成器遍历所有样本之外，还有什么方法可以解决这个问题吗？

我在这里发现有人有类似的问题keras predict_generator is shuffling its output when using a keras.utils.Sequence ，但是他的解决方案并不能解决我的问题，因为我没有编写任何自定义函数。

最佳答案

没有进行随机化或洗牌，发生的情况是，由于验证生成器的批量大小并未完全除以样本数，因此剩余的样本会溢出到下次调用生成器时，这会造成困惑一切。

您可以做的是为验证生成器设置一个批量大小，该批量大小恰好除以验证样本的数量，或者将批量大小设置为 1。

关于python - 防止 Predict_generator 打乱批处理，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52989085/

25

4

0

文章推荐： Python 使用代理

文章推荐： C# If Else 语句选择合适的 Xpath 表达式

文章推荐： c# - 如何在 MyClass :Hub 中存储数据

r - Keras predict_generator 中的输出顺序
我遵循了有关在 R 中使用 Keras 进行图像识别的在线教程，最终代码如下: library(keras) view_list % layer_conv_2d(filter = 32, kern
tensorflow - 如何通过循环将 Predict_generator 输出写入文件？
我有一个大型图像数据集，我想在其上运行预测生成器。由于内存问题，我无法同时运行所有这些。这个想法是通过循环图像范围并对其进行预测，以迭代方式将一小组图像提供给生成器。将预测保存到文件稍后循环打开
python - 防止 Predict_generator 打乱批处理
我正在尝试检查我的模型在验证数据集上的性能。因此，我使用 predict_generator 从我的 validation_generator 返回预测。但是，我无法将预测与从 validation_
python - Keras:predict_generator 的输出是什么？
Keras 文档说它返回“一个 Numpy 预测数组”。在 4 个类的 496 个图像示例上使用它，我得到一个 4 维数组(496、4、4、512)。其他2个维度是什么？最终，我想要一个 X 数组(示
python - 如何在新图像上使用 .predict_generator() - Keras
我使用 ImageDataGenerator 和 flow_from_directory 进行训练和验证。这些是我的目录: train_dir = Path('D:/Datasets/Trell/i
python - keras model.predict_generator() 未返回正确的实例数
我已按照以下链接学习如何使用keras模型的generator来fit_generator。 https://stanford.edu/~shervine/blog/keras-how-to-gene
python - Keras 的 predict_generator 没有返回正确数量的样本
我正在尝试实现一个自定义数据生成器，它使用 pandas.read_csv 从 csv 文件中读取数据 block 。我使用 model.predict_generator 对其进行了测试，但返回的预
python - 获得 model.predict_generator 的测试精度
我正在调用 model.predict_generator() 方法对测试数据集进行预测。我的问题是如何检索测试准确性？以下是我的代码行: predictions = model.predict_ge
python - 如何解释 keras "predict_generator "输出？
我正在实现图像分类项目。我已经生成并保存了模型。训练成功了。当我在 keras 中使用 predict_generator 对测试图像进行分类时，对于每个图像，我在预测 numpy 数组中为每个图
python - 从 Keras model.predict_generator 计算准确性
我有 Keras 模型，我想使用我的测试数据对其进行评估。当我使用 keras model.evaluate_generator 时，我得到了它返回的 loss 和 acc，我可以打印百分比精度，如下
python - Keras:如何评估模型准确性(evaluate_generator 与 predict_generator)？
对于二元分类问题，我从 keras evaluate_generator() 和 predict_generator() 获得了不同的模型精度: def evaluate_model(model, g
python - 如何将 predict_generator 与 ImageDataGenerator 一起使用？
我是 Keras 的新手。我训练了一个模型并想预测存储在子文件夹中的一些图像(例如用于训练)。为了进行测试，我想预测 7 个类(子文件夹)中的 2 个图像。下面的 test_generator 看到了
r - 如何从 R keras 中的 predict_generator() 输出中检查相应的文件
我有以下代码。数据集可以下载here或 here .数据集包含分类为 cat 的图像或 dog . 这段代码的任务是训练猫狗图像数据。所以给定一张图片，它可以判断它是猫的还是狗的。正是以此为动力p
Keras:model.evaluate_generator 和 model.predict_generator 有什么区别
我使用keras数据增强来执行图像分类(十类图像)。最后一个训练周期的结果如下: Epoch 50/50 4544/4545 [============================>.] - ET
Keras:从 ImageDataGenerator 或 Predict_generator 获取真实标签 (y_test)
我正在使用 ImageDataGenerator().flow_from_directory(...) 从目录生成批量数据。模型成功构建后，我想获得真实和预测类标签的两列数组。使用 model.pr
python-3.x - 我应该如何使用 mode.predict_generator 来评估混淆矩阵中的模型性能？
我正在尝试使用混淆矩阵评估常见狗和猫过滤数据集中的迁移学习模型。我的代码基于tensorflow的迁移学习教程。训练的准确率图表显示准确率高于 90%。但是，使用生成器获取真实的 labes 并使用
python - Keras:正确使用 fit_generator、predict_generator 和 evaluate_generator
我在使用 fit_generator、predict_generator 和 evaluate_generator 时遇到了奇怪的行为，我想问以下问题，我在文档中找不到答案: 在使用 fit_gene
machine-learning - “predict_generator”返回大于 1 且小于 0 的值
我使用 Autokeras 来训练我的模型，然后使用 fit_final 将其保存为纯 keras h5 文件。我的模型: from autokeras import ImageClassifier
python - keras predict_generator 在使用 keras.utils.Sequence 时正在改组其输出
我正在使用 keras 构建一个输入 720x1280 图像并输出值的模型。在使用 keras.utils.Sequence 类获取与验证图像对应的值时，我遇到了 keras.models.Sequ
machine-learning - keras 中的 model.predict_classes 与 model.predict_generator
我知道predict_generator输出概率。为了获得类别，我只需找到最大概率的索引，这将是最可能的类别。但是我发现这样做后，我得到的输出与调用 Predict_classes 时得到的输出不同。

首页

博学

6Ren·AI

商城

python - 防止 Predict_generator 打乱批处理