machine-learning - 神经网络发散而不是收敛-6ren

machine-learning - 神经网络发散而不是收敛

转载作者：行者123 更新时间：2023-11-30 08:27:46

27

4

我已经实现了一个 2 层的神经网络(使用 CUDA)。 (每层 2 个神经元)。我试图让它使用反向传播学习 2 个简单的二次多项式函数。

但是它没有收敛，而是发散(输出变得无穷大)

以下是有关我所尝试的更多详细信息:

我已经检查并重新检查了我的代码，但似乎没有任何问题。

所以这是我的问题:这里出了什么问题？

任何指针将不胜感激。

最佳答案

如果您要解决的问题是分类类型，请尝试 3 层网络(根据 Kolmogorov，3 层就足够了)从输入 A 和 B 到隐藏节点 C 的连接 (C = A*wa + B* wb) 表示 AB 空间中的一条线。该线划分了正确和错误的半空间。从隐藏层到输出的连接使隐藏层值相互关联，从而提供所需的输出。
根据您的数据，误差函数可能看起来像发梳，因此实现动量应该会有所帮助。事实证明，将学习率保持在 1 对我来说是最佳选择。
您的训练类(class)每隔一段时间就会陷入局部最小值，因此网络训练将包含几个后续类(class)。如果 session 超过最大迭代次数或幅度太高，或者错误明显很高 - session 失败，请开始另一个 session 。
在每次开始时，使用随机 (-0.5 - +0.5) 值重新初始化权重。
它确实有助于绘制错误下降图。你会得到“啊哈!”的感觉。因素。

关于machine-learning - 神经网络发散而不是收敛，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17985319/

27

4

0

cuda - CUDA中分支的概念(采取、不采取、发散)
在 Nsight Visual Studio 中，我们将有一个图表来呈现“已采取”、“未采取”和“分歧”分支的统计信息。我对“不采取”和“分歧”之间的区别感到困惑。例如 kernel() { if
cuda - CUDA中分支的概念(采取、不采取、发散)
在 Nsight Visual Studio 中，我们将有一个图表来呈现“已采取”、“未采取”和“分歧”分支的统计信息。我对“不采取”和“分歧”之间的区别感到困惑。例如 kernel() { if
git - 如何创建反射(reflect)另一个(发散)分支状态的提交？
我想提交并将其复制到我的存储库中的其他地方。现状: A--B--C--D (branch1) \ E--F (branch2) 期望的情况: A--B--C--D--F'(bran
git - 如何防止 fork 的 git repo 发散
以下一系列 git 命令导致 repos 出现分歧。我究竟做错了什么？来自 GitLab 的 Fork 项目 call the parent project 'upstream' 从 fork 项目