gpt4 book ai didi

c# - 神经网络 OCR - 需要参数帮助 - Coursera Ng 的示例

转载 作者:行者123 更新时间:2023-11-30 09:12:52 25 4
gpt4 key购买 nike

我正在用 C# 实现 Ng 的 OCR 神经网络示例。我认为我已经正确实现了所有公式[矢量化版本],并且我的应用程序正在训练网络。

关于如何看到我的网络在识别方面的改进,有什么建议吗 - 无需在训练完成后通过绘制示例来手动测试示例?我想在训练过程中了解我的训练进展情况。

我已经在绘制的数字上测试了我训练的权重,所有神经元的输出都非常相似(大约 0.077,或类似​​的东西......在所有神经元上),并且最大值位于错误的神经元上。所以结果与绘制的图像不匹配。

这是我迄今为止所做的唯一测试:成本函数随时代的变化 enter image description here

所以,这就是成本函数(有人称之为目标函数?)在 50 个时期内发生的情况。我的 Lambda 值设置为 3.0 ,学习率为 0.01,5000 个示例,我在每个时期之后进行批处理,即在这 5000 个示例之后。激活函数:sigmoid。

输入:400隐藏:25输出:10

我不知道 lambda 和学习率的正确值是多少,以便我的网络可以在不过度拟合或欠拟合的情况下进行学习。

有什么建议可以了解我的网络学习情况吗?

此外,在所有这些训练之后,J 成本函数应该具有什么值? 它应该接近零吗?

我应该有更多的纪元吗?

我的示例全部按数字排序是不是很糟糕?

感谢任何帮助。

最佳答案

:对于如何确定我的网络学习情况有什么建议吗?
A:将数据分为三组训练、交叉验证和测试。使用测试数据验证您的结果。这实际上是后面类(class)中的地址。

:另外,在所有这些训练之后,J 成本函数应该具有什么值?它应该接近零吗?
A:我记得Ng在作业中提到什么是期望值。正则化成本不应为零,因为它包括所有权重的总和。

:我应该有更多的纪元吗?
A:如果你运行你的程序足够长的时间(少于 20 分钟?),你会发现成本并没有变小,我认为它达到了局部/全局最优,所以不需要更多的 epoch。

:我的例子都是按数字排序的,这样会不会不好?
A:算法修改每个示例的权重,因此不同的数据顺序确实会影响批处理中的每个步骤。不过最终结果应该不会有太大差异。

关于c# - 神经网络 OCR - 需要参数帮助 - Coursera Ng 的示例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27234259/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com