- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在研究 CNN 分类问题:
使用 CNN 将音频情绪分为 6 类(愤怒、厌恶、恐惧、快乐、悲伤、中性)。我使用的是 EMODB 数据集,输入特征是傅里叶变换 [256*36]。我的 CNN 网络有 3-4 个卷积层,每个卷积都有最大池化,再加上一个全连接层。但学习曲线显示训练和验证损失之间存在很大差距,表明严重过度拟合。我能得到的最佳验证准确度始终在 75% 到 80% 之间。
learning curve这是我得到的学习曲线之一。黑色和蓝色分别是训练精度和损失。另外两个用于验证准确性和损失。即使训练损失变为 0,验证结果也不再改善。
我尝试扩充我的数据集,向 fc 层添加 50% 的 dropout,向 fc 层添加 l2 正则化,并使用学习率衰减策略(如 caffe 中的“inv”)。但差距仍然存在。
是不是因为我的数据集太小?
我总共有大约 500 个音频,并将其扩展到大约 6,000 个样本。但当我把数据增加到15000时,差距还是很大。 15,000 对于 CNN 来说仍然是一个小数据集吗?
是否是因为数据增强过程引入了错误?
我的原始数据集由大约 500 个不同长度的音频组成,长度从 1 秒到 6 秒不等。所以我只是随机抽取1.2s的样本。持续时间越长,我得到的样本就越多。现在我可以有超过 15,000 个样本进行训练。我在想,对于长音频来说,1.2s的样本会丢失太多信息,并且可能无法代表相应情绪的特征。但这是我能想到的最好方法,因为由于某种原因我无法使用 RNN 或 HMM 来处理数据。
我的特征计算有可能出错吗? (虽然我已经检查过好几遍了)我也尝试过MFSC特征[120*40],但是两个特征集都有类似的过拟合问题..
还是我的网络不够好?我认为更复杂的网络会引入更多的过度拟合。但是简单的网络并没有表现出良好的性能。
尽管我列出了很多过度拟合的原因,但我无法弄清楚哪些是影响性能的真正因素。有什么方法可以知道哪个部分出了问题吗?或者有什么减少过度拟合的建议吗?
谢谢!
最佳答案
您可以尝试在 CNN 中添加一些“dropout”层,看看是否可以减少过度拟合。 ——文卡特
关于machine-learning - 增加训练数据并不能减少 CNN 的过度拟合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38098560/
我是 javascript 的新手(今天开始弄乱它)。 我正在尝试更改名为“bar”的元素(div)的高度。条形图将成为图表的一部分。 我可以毫无问题地将按钮连接到更改栏高度的函数。一切正常,除了条形
错误 -> “UIVIew”没有名为“addSubView”的成员 override func viewDidLoad() { super.viewDidLoad() // Do an
我在命令行工具项目中复制并粘贴了 main.swift 下面链接中的代码。 How do you use CGEventTapCreate in Swift? 它构建没有错误,但是当我运行时, gua
我在尝试编译我的代码时遇到以下错误。 ERROR! ..\myCode\CPOI.cpp:68:41: error: cannot dynamic_cast 'screenType' (of type
我正在尝试将多个字符串连接到一个我已为其分配内存的字符串指针。这是一个例子: char *finalNumString = malloc(sizeof(char)*1024); finalNumStr
我在使用 dup2() 和 pipe() 时遇到问题。 当我尝试将管道的写入端 dup2 到 STDOUT_FILENO 时,我收到了 EBADF。 我用 gdb 在 dup2(pout[1], ST
首先,我应该说我运行的是 Windows 7。 因此,今天早上我尝试像往常一样从我的存储库中提取数据,但我做不到。我得到了错误: The authenticity of host 'github.co
刚开始在虚拟环境中运行Python,乱用Django,无法激活虚拟环境。 花了最后 4 个小时尝试在本地终端/VS 代码上激活虚拟环境 (venv),但没有成功。 避免使用“sudo pip inst
Tidyverse 的粉丝经常给出使用小标题而不是数据框的几个优点。它们中的大多数似乎旨在保护用户免于犯错误。例如,与数据框不同,小标题: 不需要 ,drop=FALSE不从数据中删除维度的论据。 不
我一直在对 Elm 应用程序进行 docker 化时遇到问题。据我所知,我已经创建了一个完整且有效的 Docker 文件……但它不起作用。 我会解释的。 所以我的脚本在 3 个文件中运行。 首先是启动
我可以在 Controller 中使用@Autowired,例如 @RestController public class Index { @Autowired HttpServlet
我定义了一个方法和一个函数: def print(str:String) = println val intToString = (n:Int) => n.toString 现在我想创作它们。 我的问
当我控制台单独记录变量“pokemons”时,它确实返回一个数组。但是当我尝试映射它时,出现错误: TypeError: pokemons.map is not a function 我的代码: im
每当我尝试在 Python 解释器中导入 smtplib 时,都会收到此错误: ImportError: cannot import name fix_eols 我该如何解决这个问题? 编辑:这是完整
我正在使用 Meteor.js 开发一个项目,但在使用 Handlebar 时遇到了一些问题:我想检索集合的最后一项,并显示字段:其中包含 html 的文本: 这是我的javascript代码: Te
你好,我想使用 Service 实现 GestureDetector 但是我有这个错误The method onTouchEvent(MotionEvent) of type GestureServi
我正在尝试在 Controller bean 中 Autowiring 接口(interface) 在我放置的上下文配置文件中 和 我的 Controller 类是 @Controller pub
我试图在 mainwindow.cpp 中包含 QtSvg,但是当我编译时它说无法打开包含文件:QtSvg。我已经在我的 *.pro 文件中添加了这个(QT += svg)。我可以知道可能是什么问题吗
鉴于以下 PostgreSQL 代码,我认为这段代码不容易受到 SQL 注入(inject)攻击: _filter 'day' _start 1 _end 10 _sort 'article_name
我想执行以下操作。这在 MySQL 中是非法的。 PostGRESQL 中关联的 CTE(“with”子句)有效。这里的假设是 MySQL 中的子查询不是完全限定的 CTE。 请注意:这个查询显然非常
我是一名优秀的程序员,十分优秀!