gpt4 book ai didi

machine-learning - 卷积 ImageNet 网络对于翻转图像具有不变性

转载 作者:行者123 更新时间:2023-11-30 08:41:11 25 4
gpt4 key购买 nike

我正在使用深度学习caffe框架进行图像分类。
我有一些有头像的硬币。其中一些是左向的,一些是右向的。

为了对它们进行分类,我使用常见的方法 - 从已捕获大量图像模式的预训练 ImageNet 网络中获取权重和结构,并主要训练最后一层以适应我的训练集。

但我发现网络在这台设备上不起作用:我拿了一些硬币,例如 leftdirected ,为其生成水平翻转图像并将其标记为右侧。

right sided face

对于这组卷积网络,准确率约为 50%,这完全是随机结果。

我还尝试在 2 个图像(“h”字母的 2 个翻转版本)上训练网络。但结果相同 - 50% 。 (如果我选择不同的字母并在增强数据集上训练网络 - 我很快就能获得 100% 的准确率)。但翻转的不变性打破了我的分类。

enter image description here enter image description here

我的问题是:是否存在某种方法可以让我利用预训练 imagenet 的优势,但以某种方式打破了这种不变性。网络上的哪一层使不变性成为可能。

我正在使用“caffe”基于此示例方法生成网络:

https://github.com/BVLC/caffe/blob/master/examples/02-fine-tuning.ipynb

最佳答案

在图像网络上训练的 Caffe 基本/基线模型大多使用非常简单的图像增强:水平翻转图像。也就是说,水平翻转时,imagenet 类确实是相同的。因此,您尝试微调的权重是在应忽略水平翻转的设置中进行训练的,我想您看到的是一个很好地捕获了这一点的网络 - 它不再对这种特定的转换敏感。
判断这种不变性发生在网络的哪一层并不是一件容易的事,因此很难说应该微调哪些层来克服这种行为。我认为这种不变性对于网络来说非常重要,如果它需要重新训练整个网络,我不会感到惊讶。

关于machine-learning - 卷积 ImageNet 网络对于翻转图像具有不变性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38541639/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com