c# - 神经网络 OCR - 需要参数帮助 - Coursera Ng 的示例-6ren

c# - 神经网络 OCR - 需要参数帮助 - Coursera Ng 的示例

转载作者：行者123 更新时间：2023-11-30 09:12:52

25

4

我正在用 C# 实现 Ng 的 OCR 神经网络示例。我认为我已经正确实现了所有公式[矢量化版本]，并且我的应用程序正在训练网络。

关于如何看到我的网络在识别方面的改进，有什么建议吗 - 无需在训练完成后通过绘制示例来手动测试示例？我想在训练过程中了解我的训练进展情况。

我已经在绘制的数字上测试了我训练的权重，所有神经元的输出都非常相似(大约 0.077，或类似的东西......在所有神经元上)，并且最大值位于错误的神经元上。所以结果与绘制的图像不匹配。

这是我迄今为止所做的唯一测试:成本函数随时代的变化 enter image description here

所以，这就是成本函数(有人称之为目标函数？)在 50 个时期内发生的情况。我的 Lambda 值设置为 3.0 ，学习率为 0.01，5000 个示例，我在每个时期之后进行批处理，即在这 5000 个示例之后。激活函数:sigmoid。

输入:400隐藏:25输出:10

我不知道 lambda 和学习率的正确值是多少，以便我的网络可以在不过度拟合或欠拟合的情况下进行学习。

有什么建议可以了解我的网络学习情况吗？

此外，在所有这些训练之后，J 成本函数应该具有什么值？ 它应该接近零吗？

我应该有更多的纪元吗？

我的示例全部按数字排序是不是很糟糕？

感谢任何帮助。

最佳答案

问:对于如何确定我的网络学习情况有什么建议吗？
A:将数据分为三组训练、交叉验证和测试。使用测试数据验证您的结果。这实际上是后面类(class)中的地址。

问:另外，在所有这些训练之后，J 成本函数应该具有什么值？它应该接近零吗？
A:我记得Ng在作业中提到什么是期望值。正则化成本不应为零，因为它包括所有权重的总和。

问:我应该有更多的纪元吗？
A:如果你运行你的程序足够长的时间(少于 20 分钟？)，你会发现成本并没有变小，我认为它达到了局部/全局最优，所以不需要更多的 epoch。

问:我的例子都是按数字排序的，这样会不会不好？
A:算法修改每个示例的权重，因此不同的数据顺序确实会影响批处理中的每个步骤。不过最终结果应该不会有太大差异。

关于c# - 神经网络 OCR - 需要参数帮助 - Coursera Ng 的示例，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27234259/

25

4

0

文章推荐： javascript - 根据多个条件合并行以发送到电子邮件

文章推荐： python - 对于 MultinomialNB，Sklearn 偏向正值

r - Coursera 空气污染作业
使用 Mac 操作系统 10.10.3RStudio 版本 0.98.1103 我的工作目录是一个包含 332 个 .csv 文件的列表，我的设置是正确的。这是代码: pollutantmean <-
scala coursera 函数式编程作业 FunSets
我在 coursera 上的 scala 中参加了 martin odersky 的函数式编程类(class)。但是，我无法理解第二个作业 Funsets.scala 的解决方案。 type Set
c++ - Coursera 自动评分器给我未知信号 11
我正在上一门算法课，现在我们正在学习贪婪算法。我的两个解决方案在某些测试用例上输出“未知信号 11”。但是，我用尽可能大的输入将我的程序推向了极限。它在我的电脑上运行得很好。然而，在 Courser
scala - 为什么顺序在事件中很重要？ Coursera-Scala
我在 Coursera 上问了这个问题，但没有人回复，所以我来到这里。这是关于 Scala 函数式编程原理类(class)的最后一个作业(Anagrams)。如果函数减法返回无序出现，Anagram
javascript - 通过程序获取 Coursera 视频下载链接
我想通过这些链接后面的程序(主要是 Python)提取 Coursera 视频下载链接 https://www.coursera.org/learn/human-computer-interactio
python - Coursera jupyterNotebook : revert to the beginning
我正在使用 Coursera 的 jupyterNotebook，但没有办法将所有内容恢复到开头。唯一相关的选项似乎是“恢复到检查点”——但我一开始没有保存检查点。这是否意味着我无法恢复到它？最
httprequest - 如何获取 Coursera API 文档？
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 2个月前关闭。 Improve th
python - coursera-dl osx 不是从命令行运行的
我正在尝试从 OS X Mavericks 上的命令行运行 coursera-dl。控制台输出如下: $ coursera-dl Traceback (most recent ca
windows - Coursera - Scala 中的函数式编程原则 - 由于错误而无法使用示例项目
来自那门类(class) https://class.coursera.org/progfun-004/assignment 我下载了 http://spark-public.s3.amazonaws
javascript - Coursera Node.js 斐波那契实现挂起
我目前正在为 coursera 上提供的创业工程类(class)学习 program 2 我正在使用 Amazon Web 服务使用 ubuntu 实例进行编程，但我的编程一直挂起。我的 node.j
performance - coursera progfun1 : scala union performance
在完成“Scala 中的函数式编程原则”@coursera 类(class)第 3 周的作业时，我发现当我实现视频类(class)中所示的函数联合时: override def union(tha
gradient - 为什么我的梯度是错误的(Coursera、Logistic 回归、Julia)？
我正在尝试从 Julia 中的 Coursera 进行逻辑回归，但它不起作用。计算梯度的 Julia 代码: sigmoid(z) = 1 / (1 + e ^ -z) hypotesis(thet
python - Coursera ML - 在 python 中实现正则化逻辑回归成本函数
我正在 Coursera 上学习 Andrew Ng 的机器学习，方法是使用 Python 而不是 MATLAB 实现所有代码。在编程练习 3 中，我以向量化形式实现了正则化逻辑回归成本函数: de
math - Coursera 机器学习 : Gradient Descent vectorization
我在理解如何对 Coursera 上提供的机器学习类(class)中的函数进行矢量化时遇到问题。在类(class)中，Andrew Ng 解释了假设可以向量化为 theta 乘以 x 的转置: H(
python - 使用 Python 登录 Coursera 帐户
我从 MOOC 中学到了很多东西，所以我想为此返回一些东西我正在考虑在 kivy 中设计一个小应用程序，因此需要 python 实现，实际上我想要实现的是记录通过程序进入我的 Coursera 帐户并
c++ - 代码在我的系统中运行良好，但 coursera autograder 给我未知信号
任务 -- 此代码问题的目标是实现二分查找算法。输入格式 -- 输入的第一行包含一个整数 n 和一个序列 a0 &a, long long x) { size_t left = 0, righ
javascript - Angular jsonp 请求 coursera api 给出错误
当我尝试在 Angular 中使用 jsonp 方法请求 coursera api 时，出现以下错误。 Refused to execute script from 'https://api.cour
c# - 神经网络 OCR - 需要参数帮助 - Coursera Ng 的示例
我正在用 C# 实现 Ng 的 OCR 神经网络示例。我认为我已经正确实现了所有公式[矢量化版本]，并且我的应用程序正在训练网络。关于如何看到我的网络在识别方面的改进，有什么建议吗 - 无需在训练完
java - 如何在 Eclipse 中使用库进行算法第一部分 Coursera 类(class)
我已经开始 Coursera Algorythms course .练习作业必须在Java上完成，他们建议使用DrJava作为IDE，但这真的很不方便。所以我想使用 Eclipse，但问题是我无法使用
java - coursera java 类(class)中方法 getAverageRank 的问题
我正在 coursera java 类(class)中做作业。作业是关于java中的统计数据，他们给了我一些文件，其中包含每个名字的出生数量，并想要每个名字的排名，例如hesham 15，ahmed

首页

博学

6Ren·AI

商城

c# - 神经网络 OCR - 需要参数帮助 - Coursera Ng 的示例