tensorflow - 如何定制 AlexNet 以适应不同的用途-6ren

tensorflow - 如何定制 AlexNet 以适应不同的用途

转载作者：行者123 更新时间：2023-11-30 09:42:13

25

4

所以，过去一周我一直在学习一些机器学习，并且一直在摆弄我自己的回归 CNN，输入 128x128 的彩色图像并输出评级。虽然我的数据集很小，总共 400 左右，但我得到了不错的结果，但有一点过度拟合(训练的平均绝对误差为 0.5，规模 1-10 的测试平均绝对误差为 0.9)，模型如下:

model = keras.Sequential([
    keras.layers.Conv2D(32, kernel_size=(5, 5), strides=(1, 1), activation='relu', input_shape=(128, 128, 3)),
    keras.layers.Dropout(0.15),
    keras.layers.MaxPooling2D(pool_size=(2, 2), strides=(2, 2)),
    keras.layers.Conv2D(64, kernel_size=(5, 5), activation='relu'),
    keras.layers.Dropout(0.15),
    keras.layers.MaxPooling2D(pool_size=(2, 2)),
    keras.layers.Flatten(),
    keras.layers.Dense(1000, activation='relu'),
    keras.layers.Dropout(0.4),
    keras.layers.Dense(1)
])

但是，由于对结果不满意，我想尝试经过验证的真实模型。所以我使用了 AlexNet:

model = keras.Sequential([
    keras.layers.Conv2D(filters=96, kernel_size=(11, 11), strides=(4, 4), activation='relu', input_shape=(128, 128, 3), padding='same'),
    keras.layers.MaxPooling2D(pool_size=(2, 2), strides=(2, 2), padding='same'),
    keras.layers.Conv2D(filters=256, kernel_size=(11, 11), strides=(1, 1), activation='relu', padding='same'),
    keras.layers.MaxPooling2D(pool_size=(2, 2), strides=(2, 2), padding='same'),
    keras.layers.Conv2D(filters=384, kernel_size=(3, 3), strides=(1, 1), activation='relu', padding='same'),
    keras.layers.Conv2D(filters=384, kernel_size=(3, 3), strides=(1, 1), activation='relu', padding='same'),
    keras.layers.Conv2D(filters=256, kernel_size=(3, 3), strides=(1, 1), activation='relu', padding='same'),
    keras.layers.MaxPooling2D(pool_size=(2, 2), strides=(2, 2), padding='same'),
    keras.layers.Flatten(),
    keras.layers.Dense(4096, activation='relu'),
    keras.layers.Dropout(0.4),
    keras.layers.Dense(4096, activation='relu'),
    keras.layers.Dropout(0.4),
    keras.layers.Dense(1000, activation='relu'),
    keras.layers.Dropout(0.4),
    keras.layers.Dense(1)
])

但是，它的收敛速度要慢得多，并且在训练 MAE 为 1.2、测试 MAE 为 0.9 时基本稳定。虽然这确实显示出较少的过度拟合，但我认为奇怪的是我仍然得到相同的测试结果。我的 AlexNet 实现是否有缺陷，或者这不是 AlexNet 的正确应用程序。我知道它通常用于分类，但我认为回归可能值得尝试。任何信息/建议/批评都有帮助，谢谢!

最佳答案

我没有发现您的 AlexNet 实现有任何明显的错误。但我想指出几点。

第一个模型中使用dropout的方式

在卷积输出之后应用Dropout并不是标准的事情。当您以这种方式应用 dropout 时，Convolution 输出中的输出会随机关闭。但与全连接层不同，卷积输出具有“空间”结构。我想说的是，切换完整 channel 比关闭随机神经元更有意义。我认为一个插图会有所帮助。想象一个 channel 输出对应于全连接层的单个神经元(不是最好的类比，但它有助于理解我的建议)。

或者另一种选择是在卷积输出后去除 Dropout ，而仅在全连接层后具有 Dropout 。

AlexNet 收敛所需的时间

AlexNet 比模型 1 大得多，这意味着参数比第一个模型多得多。因此，需要更长的时间才能收敛是有道理的。

为什么准确率低？

我能想到的一件事是 Flatten() 层之前的输出大小。在模型 1 中，它是 32x32，而在 Alexnet 中，它是 4x4，非常小。因此，完全连接的层只有很少的来自卷积层的信息。这可能会导致 AlexNet 表现不佳(只是猜测)。

关于tensorflow - 如何定制 AlexNet 以适应不同的用途，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57280261/

25

4

0

文章推荐： java - 正确使用backing beans

文章推荐： javascript - 滚动显示不起作用

文章推荐： javascript - 追加另一个 Div

html - Div调整大小/适应
我遇到了问题，似乎无法解决。基本上，我希望我的菜单和文本随着分辨率的变化/放大/缩小而调整大小；图片工作正常，内容 div 工作正常，只是菜单似乎无法适应。请帮我解决这个问题.. 普通 View
java - 适应 map 缩减框架有哪些挑战性问题？
我在map reduce上开发了大约20个工作，包括pagerank算法。我从未发现任何具有挑战性的问题可以在线适应mapreduce框架。我想提高自己的技能。有这样的指南吗？最佳答案您正在寻找的
java - 为什么我不能使用这种运算符组合来使 NOR 适应 Java
我了解到 Java 中没有 NOR，我可以使用 !A && !B 或 !(A||B)。既然 A 和 B 都是假的，为什么我不能使用 !A || B？最佳答案因为Java没有NOR运算符，你的表达式
go - 适应 GO 构建到不同的操作系统
我需要根据构建 CLI 工具的要求评估“GO”，该工具应该可以在不同的操作系统中运行。这是如何在诸如“Cloud Foundry CLI”之类的 CLI 工具中实现的？GO 如何处理这种对操作系统的适
javascript - 下拉，适应 parent 的宽度？
所以我试图让我的下拉菜单正常工作。下拉列表位于我的标题中的列表项下，该列表项会根据用户的用户名而变化。这使得大小不同，但我无法让下拉菜单跟随宽度调整大小。示例 1: http://jsfiddle.
python - '重新排序'/适应 matshow 矩阵图的刻度
我已经很努力了，但我还是被 matplotlib 卡住了。请忽略，mpl 文档让我有点困惑。我的问题涉及以下方面: 我用 matshow 函数画了一个对称的 n*n 矩阵 D。行得通。我想做同样的事
c++ - 适应 Boyer-Moore 实现
我正在尝试调整 Boyer-Moore c(++) Wikipedia implementation获取字符串中模式的所有匹配项。实际上，维基百科实现返回第一个匹配项。主要代码如下: char* bo
html - 让 child 适应 parent
我在底部嵌套了带有文本的 flex 元素。顶部元素具有小于文本的固定宽度: .list-header { display: flex; width: 150px; height: 80px
c++ - 仅使用虚拟复制构造函数 move 适应 std::any 的类型是否安全？
我想初始化 std::any带有仅 move 类型变量。我找到了 Cannot move std::any . 编译错误案例在使用链接答案中的 shared_ptr 解决方法之前，我测试了以下代码:
android - 如何从 url 适应 webview 中的图像
现在我正在使用 webview 处理 ListView 。在这个 listview webview 中用于显示图像。它来自 url。现在我面临一个问题，我无法从 url 获得唯一尺寸的图像，一些图像很
c++ - 如何使 Makefile 适应 make 测试目标？
我的文件夹结构是这样的: src --main.cpp tests --src ----main_test.cpp Makefile 我想制作一个像make main_test这样的目标，以便能够以.
java - 如何摆脱不必要的(？)代码——适应 DRY 原则
前段时间我也在讨论类似的话题。我正在查看我的应用程序，我认为它有很多不必要的代码。我的意思是我有服务负责从两家书店的不同类别的书籍中抓取数据。现在我有 5 个类别，所以我有 5 个方法，但如果我要添加
CSS:如何让 child 适应 parent 的宽度
我使用多个 div 子元素创建父元素，然后根据 data-value 属性在 JavaScript 中计算这些子元素的宽度。如果我对所有 child 的计算宽度求和，我最终将得到 100%。但出于某
ruby - 无法使气刹 gem 适应 Sinatra 应用程序
我像这样使用减速板 gem : require 'airbrake' Airbrake.configure do |config| config.api_key = 'XXXXX' confi
svn - 适应 svn :externals usage for move to Mercurial
我们在企业环境中有一个 svn 存储库结构，如下所示: root libs shared_lib1 shared_lib2 private_lib public_cod
iphone - 以编程方式使 uiview 适应 iPad/iPhone 屏幕
我制作了一个应用程序，其中有许多从 UIView 子类化的 View 。这些 View 的大小和方向是随机的，并且可以保存应用程序屏幕的状态。当用户在打开屏幕的同一设备上保存屏幕时，屏幕状态为“正常”
java - lucene:使 StandardTokenizer 适应 Twitter 数据
我需要调整 lucene 的 StandardTokenizer 以适应有关 twitter 数据的一些特殊目的。目前，我使用 StandardTokenizer 来标记一些我想要处理的推文。它工作得
c# - 如何让 GridView 适应 Windows Store 应用程序中的不同分辨率
在Windows Store应用中，如果内容是固定的，我们可以把它封装成一个ViewBox，让内容适应不同的分辨率。但是，如果内容不固定，在我的应用程序中，有一个 GridView 哪些项目是动态的，
java - 使 JComboxBox maximumRowCount 适应 JFrame 或屏幕尺寸
一切都在标题中。在我的应用程序中，根据用户所做的选择，我用一个列表填充一个组合框，该列表有时很小(1 个元素)有时很大(150 个元素)。我想要的不是在启动时将固定高度设置为给定值，而是将 max
jquery - 如何使 jquery 适应 `@media (max-width)`
我的 2 div 动画感谢我下面的 jquery 脚本。当屏幕小于 700px 时，div 变成更小的正方形(35px 而不是 50px)。我希望 .animate({width:100px}); 仅

首页

博学

6Ren·AI

商城