neural-network - 为卷积神经网络选择训练集和验证集对测试精度有很大影响-6ren

neural-network - 为卷积神经网络选择训练集和验证集对测试精度有很大影响

转载作者：行者123 更新时间：2023-12-04 06:44:02

25

4

我正在使用德国交通标志检测基准数据库进行交通标志识别工作。这有 43 个类别，每个类别至少有 400 张图像。图片最多可包含 3 个交通标志。

当我随机选择图像用于训练和验证集时，我发现网络的测试准确度存在巨大差异。我构建了两个数据集:一个有 75% 的训练图像和 25% 的验证图像；另一个有 70% 的训练图像和 30% 的验证图像。

我正在使用具有相同超参数的 GoogLeNet 进行训练，包括 30 个时期。

训练后，我使用专为测试设计的不同图像集进行测试。使用第一个数据集，我得到的准确率比第二个数据集低近 10%。有人可以解释一下吗？

会不会是它随机选择了“更简单”的图像进行训练，这就是我得到较低结果的原因？

附言对于这两个数据集，我使用相同的图像，只是按百分比不同地划分。

数据集链接:http://benchmark.ini.rub.de/?section=gtsrb&subsection=dataset

最佳答案

你有几类标志？是否知道 GoogLeNet 在该数据集上运行良好？请记住，GoogLeNet 是专门为在 ILSVRC 2012 数据集上表现出色而设计的:近 130 万张训练图像，1000 个类别。它扩展到数百个并行内核，为解决问题提供了很大的灵 active 。

如果您遇到的问题要小得多——例如，少数几个类别中的 900 张图像——那么 GoogLeNet 的规模可能很容易使您的应用程序过度拟合。例如，请注意，1000 个参数的最终全连接层比单独识别训练集中的每个图像 需要的多。 128-200+ 过滤器的中间层将发现各种虚假特征，例如六个限速区标志周围的绿色图案。

此外，请记住，构建 GoogLeNet 是为了识别输入图像中的单个图形:交通标志数据库可能在图像中包含多达 6 个标志。这也会混淆您的训练，具体取决于您如何对多标志图像进行分类。

如果您觉得此任务需要 GoogLeNet 的复杂性，我建议您减少层的宽度。例如，ILSVRC 历史表明您的模型学习识别面部特征、车辆部件和花瓣，而道路标志在其视觉元素方面受到更多限制。因此，尽管您可能希望第一层(边缘和区域检测)保持完整，但中间层不需要那么多过滤器。

不，我无法为您提供可靠的起点:我还没有进行几个月的必要实验来针对问题调整模型。如果您想查看极端示例，请按照建议的迭代次数训练 GoogLeNet，但将其提供给 MNIST 数据库。更好的是，为它提供井字棋位置的文本处理器屏幕截图，仅分类为“赢”、“平”和“输”。

关于neural-network - 为卷积神经网络选择训练集和验证集对测试精度有很大影响，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43995642/

25

4

0

文章推荐： linq - 在 linq 查询 where 子句中使用 string.compare

文章推荐： r - 连接 data.frame 或 data.table 中的匹配列

文章推荐： facebook-oauth - Facebook php Oauth 不工作

haskell - 为什么GHC这么大/很大？
有没有一个简单的答案:为什么 GHC 这么大？ OCaml:2MB Python:15MB SBCL:9MB OpenJRE - 26MB GHC:113MB 对“如果 Haskell 是正确的工具，
apache - access_log 很大，没有被归档。如何重置？
我发现我的 access_log 占用了我的大部分硬盘。它的大小超过 200 GB。我怎样才能重置它？我在装有 Plesk 的 CentOS 服务器上使用 Apache 2.2.3。谢谢你们 !
java - 用解释器评估计算器，但值(value)很大
我正在使用 Java 中的 BeanShell 解释器来解决字符串计算问题。问题是我自己做了一些解释器无法完成的解析并将部分结果存储在 BigInteger 中。然后我将所有内容拼凑起来并交给解释器来
android - OpenCv android apk 很大
我在我的 android 项目中使用 OpenCV native 库。它是一个带有一个 CameraScreen 的 hello world 项目，它已经有 40mb。我怎样才能减少 apk 的大小，
node.js - npm 运行生产后，vendor.js 很大
我使用基于 Laravel 和 Vue.js 的 Laravue Dashboard，在在线服务器上运行，而不是本地主机，它是全新安装，没有进行任何编辑。我的问题是: 运行 npm run watc
hadoop - 如何将我的 Hbase 表(很大)分成相等的部分，以便我可以将它存储到本地文件系统中？
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 5 年前。 Improve this qu
c# - Kendo MVC ToDataSourceResult 非常慢，IQueryable 很大
我广泛使用了 Kendo DataSourceResult ToDataSourceResult(this IQueryable enumerable, DataSourceRequest reque
javascript - jQuery Mobile .ui-page min-height 很大
我使用 phonegap 构建 html\css 应用程序陪审团手机给我 div: 并且模拟器中的最小高度太大，我在底部看到黑线像这样: 如果我在 css 文件中更改 min-height: 736
MySQL:在两个表 A 和 B 中查找匹配的记录，其中 B 很大
以下工作正常但速度太慢。只需要知道B表中有匹配的记录，有什么技巧吗？ (奇怪的是相反的搜索:找到不加入的记录(IS NULL)非常快) SELECT TableA.id FROM TableA
vue.js - Bundle size 很大，如何减小 app.js 的大小？
我正在使用 Vue.js，我的项目中只有 4 个组件。我只导入了bootstrap、jquery 和lodash: import { map } from 'lodash'; import 'boo
algorithm - (2n log(n) + n) 变位词检测函数并不比 4n + 26 函数慢多少，尽管 n 很大
我有 2 个字谜检测功能；一个使用排序和比较，另一个跟踪每个字母字符出现的次数。这里假设传递给函数的两个字符串是相同的，第一个随机生成(未排序)，第二个 = 给第一个，这样两个函数都“一路”执行并返
perl - 使用 N 个并发异步 HTTP 客户端下载 M 个文件，其中 M 很大，N 是可配置的
我正在尝试编写一个脚本，该脚本将通过 HTTP 同时下载最多 N 个文件。我以前用过 AnyEvent::Worker::Pool管理阻塞任务池。我也用过 AnyEvent::HTTP结合AnyEv

首页

博学

6Ren·AI

商城

neural-network - 为卷积神经网络选择训练集和验证集对测试精度有很大影响