gpt4 book ai didi

machine-learning - 是什么让这个简单的 CNN 无法对图像是否包含猫进行分类?

转载 作者:行者123 更新时间:2023-11-30 09:49:47 24 4
gpt4 key购买 nike

我不是“猫与狗”,而是在一个全新的网络(无迁移学习)上尝试“猫与其他一切”,使用我分类为“猫”或“的大量随机互联网图像”没有猫”类别。

不幸的是,我的网络似乎不会针对此任务进行随机训练。

我的网络是基本的多层 CNN,有一个大的密集层,最后有一个 sigmoid 神经元,输出 0 或 1 来表示“是猫”或“不是猫”。我的“猫”图像由许多不同品种的猫在不同环境和背景下的多种姿势和角度的裁剪图像组成。我尝试了各种形式的数据增强、图像加权和数据/验证改组,但仍然无法从中获得有用的网络。

我错过了什么?我的架构或方法有问题吗?我是机器学习新手,使用 Keras 而不是 Tensorflow。

我的网络架构如下:

Input 320x320 RGB image into network, then:

1a) Conv layer, 32 filters, 3x3
1b) Relu and max pooling 2x2.

2a) Conv layer, 32 filters, 3x3
2b) Relu and max pooling 2x2

3a) Conv layer, 64 filters, 3x3
3b) Relu and max pooling 2x2

4) Flatten

5a) Dense 64 neurons
5b) Relu
5c) Dropout 0.5
5d) Final dense 1 neuron, sigmoid activation. (0 = cat in image, 1 = no cat in image)

我正在使用二进制交叉熵和图像旋转/移位/翻转/等。用于数据增强。我的数据集高度不平衡,每 5 张非猫图片对应 1 张猫图片。我保留了 25% 的数据集用于验证,同样具有 1:5 的不平衡。我对拟合生成器进行了加权,从而使猫图像的权重提高了 5 倍。

架构、初始化等是否存在问题,或者我只是严重低估了在现代硬件上从头开始训练 CNN 所需的时间?

最佳答案

“猫 vs 狗”示例经常使用 VGG16,如 fast.ai 中所示。当然。

其16层网络被VGG团队在ILSVRC-2014 ImageNet中使用竞赛。请参阅one implementation in Keras

您可以下载权重,然后将图像缩小到(3 channel x 224x224 像素)后将其应用于您的问题。

关于machine-learning - 是什么让这个简单的 CNN 无法对图像是否包含猫进行分类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47223531/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com