- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这个问题在这里已经有了答案:
Why should weights of Neural Networks be initialized to random numbers? [closed]
(9 个回答)
去年关闭。
在神经网络编程和初始化的背景下,我听说过很多关于“打破对称性”的说法。有人可以解释一下这是什么意思吗?据我所知,如果权重矩阵在初始化期间填充了相同的值,这与在前向和后向传播期间表现相似的神经元有关。不对称行为将通过随机初始化更清晰地复制,即,不在整个矩阵中使用相同的值。
最佳答案
你的理解是正确的。
当所有初始值都相同时,例如将每个权重初始化为 0,然后在进行反向传播时,所有权重将获得相同的梯度,因此进行相同的更新。这就是所谓的对称性。
直观地说,这意味着所有节点都将学习相同的东西,而我们不希望那样,因为我们希望网络学习不同种类的特征。这是通过随机初始化来实现的,因为这样梯度会不同,每个节点将变得与其他节点更加不同,从而实现多样化的特征提取。这就是所谓的打破对称性。
关于neural-network - "break symmetry"是什么意思?在神经网络编程的背景下?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59638646/
目前,我正在阅读C# 5.0 in a Nutshell,在类型基础(位于第 2 章)子主题中,术语预定义类型和自定义类型的对称性是介绍... ...为什么作者要讨论这些类型之间的对称性?说类型是对称
这个问题在这里已经有了答案: Why should weights of Neural Networks be initialized to random numbers? [closed] (9 个
我在 Alloy 中建模了一个图表转换链。我对解决结果的任何链都感兴趣,但有些链是完全相同的。除了签名实例之间的排列之外,它们是相同的,但实例之间的关系从一种解决方案到另一种解决方案形成完全相同的图。
使用这些值: double[] predicted = {2,2,3}; double[] expected = {2,1,3}; ...尽管预测数组和预期数组之间存在方向差异,但下面的方向对称 ja
最近我遇到了一些关于使用 fftw 及其 c2c 转换的问题(参见:3d c2c fft with fftw library)。当我发现我在使用 fftw 库时遇到的问题,我创建了一个新问题,以便以更
Same question 在安装新的hybris实例时,我尝试更改symmetry.key.master.password。但在服务器启动时抛出以下错误。 请注意:我使用随机文本/数字创建了symm
我正在尝试将 Symmetric-Android 3.10.2 集成到我的 Android 应用程序中。正在显示 java.lang.NoClassDefFoundError: org.jumpmin
这是我的代码,用于解密一些 Base64 编码的字符串(或者它的字节数组,是的): IvParameterSpec ivParameterSpec = new IvParameterSpec("ran
我是一名优秀的程序员,十分优秀!