- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用混淆矩阵评估常见狗和猫过滤数据集中的迁移学习模型。我的代码基于tensorflow的迁移学习教程。训练的准确率图表显示准确率高于 90%。
但是,使用生成器获取真实的 labes 并使用 model.predict_generator 获取预测数组会引发不一致的结果。首先,准确性不稳定,如果您第二次运行预测,它会改变值。其次,与单个实例上的 model.predict 相比,我通过使用 model.predict_generator 获得的预测似乎是错误的。
为了快速测试基于ImageDataGenerator的混淆矩阵,我下载了 5 张猫的图像和 5 张狗的图像。然后我从该文件夹创建了另一个生成器,并检查标签和类是否与训练相同。
两种奇怪的行为之后,我只是使用 sklearn 指标混淆矩阵来使用 model.predict_generator 和我从生成器获得的标签作为真实标签来评估预测。
第一次运行时,我得到了 0.9 的准确率,欢呼吧!但是,如果我第二次尝试 model.predict_generator,它会抛出数组输出的其他值,并且精度会下降到 0.5。之后它就不再改变了......什么结果是正确的?为什么会改变?
我注意到你必须运行两次才能得到最终结果,但得到的结果是错误的。我编写了一些代码来单独测试每个图像,并且我的预测没有错误。那么我做错了什么?或者发电机不适用于这种情况。这有点令人困惑
代码可以在我的 github 存储库中进行破解,如果您没有 GPU,则可以在 google colaboratory 中使用代码来运行。事实上,我的小型东芝卫星在仅 2 GB 和 300 cuda 的 nvidia gpu 上运行良好
代码被组织为 jupyter 笔记本,但是在这里我添加了代码迁移学习基于https://www.tensorflow.org/tutorials/images/transfer_learning
创建生成器:
test_base_dir = '.'
test_dir = os.path.join( test_base_dir, 'test')
test_datagen_2 = ImageDataGenerator( rescale = 1.0/255. )
test_generator = test_datagen_2.flow_from_directory( test_dir,
batch_size = 1,
class_mode = binary',
target_size = (image_size, image_size))
对于预测:
filenames = test_generator.filenames
nb_samples = len(filenames)
y_predict = model.predict_generator(test_generator,steps =
nb_samples)
y_predict
我使用 numpy 进行舍入,最终使用混淆矩阵度量
from sklearn.metrics import confusion_matrix
cm = confusion_matrix(y_true=test_generator.labels, y_pred=y_predict_rounded)
cm
手动验证是:
def prediction(path_img):
img = image.load_img(path_img, target_size=(150,150))
x = image.img_to_array(img)
x = x/255.
x = np.expand_dims(x, axis=0)
classes = model.predict(x)
plt.imshow(img)
if classes > 0.5:
print(path_img.split('/')[-1]+' is a dog')
else:
print(path_img.split('/')[-1]+' is a cat')
return classes
我按以下方式使用:
y_pred_m = []
files=[]
for filename in os.listdir(test_dir):
file = test_dir+'/'+filename
for item in os.listdir(file):
file2 = file+'/'+item
if file2.split('.')[-1]=='jpg':
files.append(file2)
预测是:
prediction_array = [prediction(img) for img in files]
np.round(prediction_array, decimals=0)
预期结果应该是具有与训练相似的准确度水平的混淆矩阵。由于单独验证每个示例似乎预测没有错误,但是 model.predict_generate 似乎出错了。
最佳答案
问题在于默认 _flow_from_directory_ 使用 shuffle = True。如果 shuffle 变为 False,则预测是正确的。然而,即使 shuffle 为 True,使用验证数据集来评估训练似乎也是正确的。我已经更新了 git 以填充这些更改
# Flow validation images in batches of 20 using test_datagen generator
test_generator = test_datagen_2.flow_from_directory( test_dir,
batch_size = 1,
class_mode = 'binary',
target_size = (image_size,
image_size),
shuffle = False)
关于python-3.x - 我应该如何使用 mode.predict_generator 来评估混淆矩阵中的模型性能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56695299/
我遵循了有关在 R 中使用 Keras 进行图像识别的在线教程,最终代码如下: library(keras) view_list % layer_conv_2d(filter = 32, kern
我有一个大型图像数据集,我想在其上运行预测生成器。由于内存问题,我无法同时运行所有这些。这个想法是 通过循环图像范围并对其进行预测,以迭代方式将一小组图像提供给生成器。 将预测保存到文件 稍后循环打开
我正在尝试检查我的模型在验证数据集上的性能。因此,我使用 predict_generator 从我的 validation_generator 返回预测。但是,我无法将预测与从 validation_
Keras 文档说它返回“一个 Numpy 预测数组”。在 4 个类的 496 个图像示例上使用它,我得到一个 4 维数组(496、4、4、512)。其他2个维度是什么?最终,我想要一个 X 数组(示
我使用 ImageDataGenerator 和 flow_from_directory 进行训练和验证。 这些是我的目录: train_dir = Path('D:/Datasets/Trell/i
我已按照以下链接学习如何使用keras模型的generator来fit_generator。 https://stanford.edu/~shervine/blog/keras-how-to-gene
我正在尝试实现一个自定义数据生成器,它使用 pandas.read_csv 从 csv 文件中读取数据 block 。我使用 model.predict_generator 对其进行了测试,但返回的预
我正在调用 model.predict_generator() 方法对测试数据集进行预测。我的问题是如何检索测试准确性?以下是我的代码行: predictions = model.predict_ge
我正在实现图像分类项目。我已经生成并保存了模型。训练成功了。当我在 keras 中使用 predict_generator 对测试图像进行分类时,对于每个图像,我在预测 numpy 数组中为每个图
我有 Keras 模型,我想使用我的测试数据对其进行评估。当我使用 keras model.evaluate_generator 时,我得到了它返回的 loss 和 acc,我可以打印百分比精度,如下
对于二元分类问题,我从 keras evaluate_generator() 和 predict_generator() 获得了不同的模型精度: def evaluate_model(model, g
我是 Keras 的新手。我训练了一个模型并想预测存储在子文件夹中的一些图像(例如用于训练)。为了进行测试,我想预测 7 个类(子文件夹)中的 2 个图像。下面的 test_generator 看到了
我有以下代码。数据集可以下载here或 here .数据集包含分类为 cat 的图像或 dog . 这段代码的任务是训练猫狗图像数据。 所以给定一张图片,它可以判断它是猫的还是狗的。 正是以此为动力p
我使用keras数据增强来执行图像分类(十类图像)。最后一个训练周期的结果如下: Epoch 50/50 4544/4545 [============================>.] - ET
我正在使用 ImageDataGenerator().flow_from_directory(...) 从目录生成批量数据。 模型成功构建后,我想获得真实和预测类标签的两列数组。使用 model.pr
我正在尝试使用混淆矩阵评估常见狗和猫过滤数据集中的迁移学习模型。我的代码基于tensorflow的迁移学习教程。训练的准确率图表显示准确率高于 90%。 但是,使用生成器获取真实的 labes 并使用
我在使用 fit_generator、predict_generator 和 evaluate_generator 时遇到了奇怪的行为,我想问以下问题,我在文档中找不到答案: 在使用 fit_gene
我使用 Autokeras 来训练我的模型,然后使用 fit_final 将其保存为纯 keras h5 文件。 我的模型: from autokeras import ImageClassifier
我正在使用 keras 构建一个输入 720x1280 图像并输出值的模型。 在使用 keras.utils.Sequence 类获取与验证图像对应的值时,我遇到了 keras.models.Sequ
我知道predict_generator输出概率。为了获得类别,我只需找到最大概率的索引,这将是最可能的类别。但是我发现这样做后,我得到的输出与调用 Predict_classes 时得到的输出不同。
我是一名优秀的程序员,十分优秀!