- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我发布了 this question昨天问我的神经网络(我正在使用随机梯度下降通过反向传播进行训练)是否陷入了局部最小值。以下论文讨论了 XOR 神经网络中的局部最小值问题。第一篇说不存在局部最小值问题,而下一篇论文(一年后写的)说 2-3-1 XOR 神经网络中存在局部最小值问题(作为除此之外,我使用的是 3-3-1,即输入层和隐藏层的偏差)。这些都是摘要(我无法访问全文,所以无法阅读):
还有another paper [PDF]这表示最简单的 XOR 网络没有局部最小值,但它似乎并不是在谈论 2-3-1 网络。
现在回到我的实际问题:我找不到任何讨论激活函数的选择、初始权重以及这对神经网络是否会陷入局部最小值有何影响的内容。我问这个问题的原因是,在我的代码中,我尝试使用标准 sigmoid 激活函数和双曲正切激活函数。我注意到,在前者中,我只有大约 20% 的时间被卡住,而在后者中,我往往更容易被卡住。每当我第一次初始化网络时,我也会随机化我的权重,所以我想知道是否有一组随机权重更容易使我的神经网络“卡住”。
就激活函数而言,由于误差最终与激活函数产生的输出有关,所以我认为是一个效果(即误差面发生变化).然而,这只是基于直觉,我更喜欢一个具体的答案(对于两点:初始权重和激活函数的选择)。
最佳答案
赋予神经网络的随机权重通常会立即限制学习期间可用的搜索空间部分。当学习率较小时尤其如此。
但是,在异或情况下(使用 3-3-1 拓扑)不应该有任何局部最小值。
我的建议是,由于网络非常小,因此当它似乎陷入局部最小值时,您应该打印边缘权重。您应该能够快速评估权重是否正确以及这些值距离为您提供完美网络还有多远。
对我来说有很大不同的一个技巧是,不是在每条训练数据之后立即更新权重,而是将错误批量化并在一个时期结束时更新权重。如果我的输入数据的前半部分属于同一个分类桶,这可以防止我的网络在早期受到影响。
这让我想到了下一点,您确定您的训练示例数量均匀分布吗?如果您提供的神经网络有 900 个正分类结果,但只有 100 个负分类结果,有时网络会认为说一切都在分类组内会更容易,因为如果确实如此,它的错误率只有 10%。许多学习算法都非常擅长寻找这类东西。
最后,无论是否达到局部最小值,激活函数都应该几乎没有区别。激活函数主要用作将实数域投影到更小的已知范围的一种方式; (0,1) 用于 sigmoid,(-1,1) 用于双曲正切激活函数。您可以将此视为一种在给定神经层(也称为特征缩放)强制所有学习特征之间的平等的方式。由于输入域是事先不知道的,它不像线性回归的常规特征缩放那么简单,因此必须使用激活函数,但在反向传播期间计算错误时会以其他方式补偿它。
关于artificial-intelligence - 激活函数和初始权重的选择是否会影响神经网络是否陷入局部最小值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8057296/
我目前正在使用发现的重力脚本 here为了在我的网页上创建重力效果,我正在本地开发 atm。 我的问题是,重力效果的激活似乎是在鼠标移动时进行的,而我需要它在文档准备好时才触发。 google.cod
我正在尝试关注 Railsbridge Intallfest 并尝试将我的第一个 Rails 应用程序部署到 heroku。我不断收到以下错误消息: Gem::LoadError: Specified
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
Home-tab 是默认选中的,但是它的颜色是灰色的:( Home Bla Contact
我没有得到它的工作,我不知道为什么......遗憾的是其他问题 + 答案没有帮助。 测试设备: iPhone 6 iPad 2 相关代码: override func viewWillTransiti
我试图加载一个 View ,就像用户已经按下 UISearchBar 一样。我希望 SearchController 加载顶部的 UISearchBar 以及取消按钮。 我已经试过了: func ac
试图在 if whiteDotDist < centerRadius - whiteDotRadius 时获取代码执行它下面的所有代码都是事件的,并且当它下面的代码被执行时它再次变为非事件状态直到if
我正在使用 anaconda python。所以每次,在我的 mac 终端中,我输入终端命令: source /Users/mylaptop/anaconda/bin/activate /Users/
在我的 Angular 项目中,我有这种代码: this.swUpdate.available.subscribe(() => { ... }); 它工作正常,但给了我关于 activated 被
我想弄清楚 Julia 包是如何工作的,因为我喜欢容器化环境。我真的很挣扎。 在 python 中,我会做类似 conda create env --name ds 的事情创建环境然后安装容器化包我会
我的宏中有一些代码如下 ChDir File_pth Workbooks.Open filename:= File_pth & "\" & open_tkt Workbooks.Open filena
长话短说,我有两张纸,一张是“原始数据”,另一张是“结果”。我试图让结果表从“原始数据”表的每第七行中提取文本或数字,因此“结果”中的 A1 将是原始数据中的 A1,“结果”中的 A2 将是“原始数据
我不知道如何做到这一点,或者我是否可以做到这一点。我有一个 jQuery UI Accordion,多个部分,每个部分包含多个 anchor 标记,每个 anchor 标记都有一个唯一的字符串 id。
我不敢相信我还没有找到任何关于此的文档,但我想知道如何命令键盘激活并接收来自它的输入。我可以找到在编辑文本字段时操作弹出键盘的所有示例。谢谢 最佳答案 您还可以使用 UIKeyInput 协议(pro
我正在尝试为我的 Electron 应用程序生成NSIS安装程序的日志。为此,我创建了一个文件'logging.nsh'来定义LogSet和LogText宏。 以下是logging.nsh文件的代码:
几周前,我开始使用 typescript 和 knockoutJS,我有一个具体的问题,但我有解决方案,它太丑了,我无法忍受,但无法从中得到任何更好的东西,有太多代码需要粘贴,但我会尽力描述我的问题:
当我尝试激活我的虚拟环境时收到此错误即源 ~/edu-venv/bin/activate -bash: /home/vagrant/edu-venv/bin/activate: No such fil
要创建触发器,似乎必须发布它才能生效。但是发布需要对“协作”分支进行 PR,这意味着我们甚至在测试触发器是否实际工作之前就必须创建一个 PR,并且还必须创建多个后续 PR,直到我们获得正确的触发器。
我是最近的 IntelliJ Idea 用户,我不知道如何启用 Hibernate。当我右键单击我的项目时,Hibernate 不会出现在“添加框架支持”菜单中(实际上我唯一可以选择的技术是 Groo
要创建触发器,似乎必须发布它才能生效。但是发布需要对“协作”分支进行 PR,这意味着我们甚至在测试触发器是否实际工作之前就必须创建一个 PR,并且还必须创建多个后续 PR,直到我们获得正确的触发器。
我是一名优秀的程序员,十分优秀!