- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在建立一个用于分类的RNN(在RNN之后有一个softmax层)。要进行正则化的选项有很多,我不确定是否只尝试所有这些,效果会一样吗?在什么情况下我应该规范哪些组件?
这些组件是:
最佳答案
效果最佳的正则化函数将取决于您的特定体系结构,数据和问题。像往常一样,没有一刀切的规则可以统治一切,但是有(有的)和(尤其是)没有的,还有通过谨慎的内省(introspection)和评估来确定最有效的系统方法。
RNN正则化如何工作?
理解它的最佳方法也许是基于信息的。首先,请参阅“学习如何进行?”和“RNN:深度与宽度”。要了解RNN正则化,必须了解RNN如何处理信息和学习,这将在后面的章节中介绍(尽管并不详尽)。现在回答这个问题:
RNN正则化的目标是任何正则化的目标:最大化信息实用性和遍历测试损失函数。然而,就RNN的重复性而言,具体方法往往存在很大差异-有些方法的效果优于其他方法。见下文。
RNN正则化方法:
重量衰减
sigmoid
,tanh
,但少一些relu
sigmoid
,tanh
逐渐变平以进行较大的激活-线性化使神经元能够继续学习activation='sigmoid'
return_sequences=False
),它们的作用类似于典型层上的权重衰减(例如Dense
)。但是,对于多对多(=True
),内核权重在每个时间步上都起作用,因此适用与上述类似的利弊。 0.2
。问题:往往会引入过多的噪音,并擦除重要的上下文信息,尤其是在时间步长受限的情况下。 recurrent_dropout
):recommended dropout 1e-3
,1e-4
,看看哪个效果更好。不要期望衰减的相同值适用于kernel
和recurrent_kernel
,尤其是取决于体系结构。检查砝码形状-如果一个比另一个小得多,则对以前的0.1
。如果看到改进,请尝试0.2
-否则,将其废弃0.2
开始。改进-> 0.4
。改进-> 0.5
,否则为0.3
。 BatchNormalization
,您不能将use_bias=False
设置为“等价”。 BN适用于输出,而不适用于隐藏到隐藏的转换。 Conv1D(strides > 1)
,许多时间步长(>1000
);削减尺寸,不应损害性能(实际上可能会改善性能)。 see_rnn.rnn_histogram
或
see_rnn.rnn_heatmap
(自述文件中的示例)
关于python - RNN正则化:要正则化哪个组件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48714407/
我错过了什么,我已完成 的安装指南中要求的所有步骤 native 脚本 运行 tns doctor 给我以下输出... C:\abc\xyz>tns doctor √ Getting environm
尝试从 {addToCart(book)}}/>}> 传递数据至}> 问题: 购物车 ( render={()=> ) 收到 null,但没有收到我尝试发送的对象 已放置“console.log...
这是 _app.tsx 的外观: function MyApp({ Component, pageProps }: AppProps) { return } 我在构建项目时遇到了这个错误: Ty
我的 Laravel Vue 组件收到以下警告: [Vue warn]: Avoid mutating a prop directly since the value will be overwrit
根据这个example更详细this one我刚刚遇到了一件奇怪的事情...... 如果我使用方法作为 addTab(title,icon,component) 并且下一步想使用 setTabComp
目前我有一个捕获登录数据的表单,一个带有 TIWDBGrid 的表单,它应该返回与我从我的 mysql 数据库登录时创建的 user_id 关联的任何主机,以及一个共享数据模块。 下面是我的登录页面代
在我的react-native应用程序中,我目前有一个本地Android View (用java编写)正确渲染。当我尝试将我的react-native javascript 组件之一放入其中时,出现以
我为作业编写了简单的代码。我引用了文档和几个 youtube 视频教程系列。我的 react 代码是正确的我在运行代码时没有收到任何错误。但是这些 react-boostrap 元素没有渲染。此代码仅
几周前我刚刚开始使用 Flow,从一周前开始我就遇到了 Flow 错误,我不知道如何修复。 代码如下: // @flow import React, { Component } from "react
我想在同一个 View 中加载不同的 web2py 组件,但不是同时加载。我有 5 个 .load 文件,它们具有用于不同场景的表单字段,这些文件由 onchange 选择脚本动态调用。 web2py
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 6年前关闭。 Improve t
Blazor 有 InputNumber将输入限制为数字的组件。然而,这呈现了一个 firefox 不尊重(它允许任何文本)。 所以我尝试创建一个过滤输入的自定义组件: @inherits Inpu
我在学习 AngularDART 组件时编写了以下简单代码,但没有显示任何内容,任何人都可以帮助我知道我犯了什么错误: 我的 html 主文件:
我想在初始安装组件时或之后为 div 设置动画(淡入)。动画完成后,div 不应消失。我正在尝试使用 CSSTransition 组件并查看 reactcommunity.org 上的示例,但我根本无
我需要一个 JSF 组件来表示甘特图。是否有任何组件库(如 RichFaces)包含这样的组件? 最佳答案 JFreeChart有甘特图和PrimeFaces有一个图像组件,允许您动态地流式传输内容。
从软件工程的角度来看,组件、模块和子系统之间有什么区别? 提前致谢! 最佳答案 以下是 UML 2.5 的一些发现: 组件:该子句指定一组结构,可用于定义任意大小和复杂性的软件系统。特别是,它将组件指
我有使用非托管程序集(名为 unmanaged.dll)的托管应用程序(名为 managed.exe)。到目前为止,我们已经创建了 Interop.unmanaged.dll,managed.exe
我有一个跨多个应用程序复制的 DAL(我知道它的设计很糟糕,但现在忽略它),我想做的是这个...... 创建一个将通过所有桌面应用程序访问的 WCF DAL 组件。任何人都可以分享他们对关注的想法吗?
我有一个 ComboBox 的集合声明如下。 val cmbAll = for (i /** action here **/ } 所有这些都放在一个 TabbedPane 中。我想这不是问题。那么我
使用 VB6 创建一个 VB 应用程序。应用程序的一部分显示内部的闪存。 当我使用 printform它只是打印整个应用程序。我不知道如何单独打印闪光部分。任何帮助,将不胜感激!.. 谢谢。 最佳答案
我是一名优秀的程序员,十分优秀!