- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我已经实现了一个 2 层的神经网络(使用 CUDA)。 (每层 2 个神经元)。我试图让它使用反向传播学习 2 个简单的二次多项式函数。
但是它没有收敛,而是发散(输出变得无穷大)
以下是有关我所尝试的更多详细信息:
3 * i + 7 * j+9
和 j*j + i*i + 24
(我将层 i
和 j
作为输入)我已经检查并重新检查了我的代码,但似乎没有任何问题。
所以这是我的问题:这里出了什么问题?
任何指针将不胜感激。
最佳答案
如果您要解决的问题是分类类型,请尝试 3 层网络(根据 Kolmogorov,3 层就足够了)从输入 A 和 B 到隐藏节点 C 的连接 (C = A*wa + B* wb) 表示 AB 空间中的一条线。该线划分了正确和错误的半空间。从隐藏层到输出的连接使隐藏层值相互关联,从而提供所需的输出。
根据您的数据,误差函数可能看起来像发梳,因此实现动量应该会有所帮助。事实证明,将学习率保持在 1 对我来说是最佳选择。
您的训练类(class)每隔一段时间就会陷入局部最小值,因此网络训练将包含几个后续类(class)。如果 session 超过最大迭代次数或幅度太高,或者错误明显很高 - session 失败,请开始另一个 session 。
在每次开始时,使用随机 (-0.5 - +0.5) 值重新初始化权重。
它确实有助于绘制错误下降图。你会得到“啊哈!”的感觉。因素。
关于machine-learning - 神经网络发散而不是收敛,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17985319/
在 Nsight Visual Studio 中,我们将有一个图表来呈现“已采取”、“未采取”和“分歧”分支的统计信息。我对“不采取”和“分歧”之间的区别感到困惑。例如 kernel() { if
在 Nsight Visual Studio 中,我们将有一个图表来呈现“已采取”、“未采取”和“分歧”分支的统计信息。我对“不采取”和“分歧”之间的区别感到困惑。例如 kernel() { if
我想提交并将其复制到我的存储库中的其他地方。 现状: A--B--C--D (branch1) \ E--F (branch2) 期望的情况: A--B--C--D--F'(bran
以下一系列 git 命令导致 repos 出现分歧。我究竟做错了什么? 来自 GitLab 的 Fork 项目 call the parent project 'upstream' 从 fork 项目
我是一名优秀的程序员,十分优秀!