- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在用 C# 实现 Ng 的 OCR 神经网络示例。我认为我已经正确实现了所有公式[矢量化版本],并且我的应用程序正在训练网络。
关于如何看到我的网络在识别方面的改进,有什么建议吗 - 无需在训练完成后通过绘制示例来手动测试示例?我想在训练过程中了解我的训练进展情况。
我已经在绘制的数字上测试了我训练的权重,所有神经元的输出都非常相似(大约 0.077,或类似的东西......在所有神经元上),并且最大值位于错误的神经元上。所以结果与绘制的图像不匹配。
这是我迄今为止所做的唯一测试:成本函数随时代的变化
所以,这就是成本函数(有人称之为目标函数?)在 50 个时期内发生的情况。我的 Lambda 值设置为 3.0 ,学习率为 0.01,5000 个示例,我在每个时期之后进行批处理,即在这 5000 个示例之后。激活函数:sigmoid。
输入:400隐藏:25输出:10
我不知道 lambda 和学习率的正确值是多少,以便我的网络可以在不过度拟合或欠拟合的情况下进行学习。
有什么建议可以了解我的网络学习情况吗?
此外,在所有这些训练之后,J 成本函数应该具有什么值? 它应该接近零吗?
我应该有更多的纪元吗?
我的示例全部按数字排序是不是很糟糕?
感谢任何帮助。
最佳答案
问:对于如何确定我的网络学习情况有什么建议吗?
A:将数据分为三组训练、交叉验证和测试。使用测试数据验证您的结果。这实际上是后面类(class)中的地址。
问:另外,在所有这些训练之后,J 成本函数应该具有什么值?它应该接近零吗?
A:我记得Ng在作业中提到什么是期望值。正则化成本不应为零,因为它包括所有权重的总和。
问:我应该有更多的纪元吗?
A:如果你运行你的程序足够长的时间(少于 20 分钟?),你会发现成本并没有变小,我认为它达到了局部/全局最优,所以不需要更多的 epoch。
问:我的例子都是按数字排序的,这样会不会不好?
A:算法修改每个示例的权重,因此不同的数据顺序确实会影响批处理中的每个步骤。不过最终结果应该不会有太大差异。
关于c# - 神经网络 OCR - 需要参数帮助 - Coursera Ng 的示例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27234259/
使用 Mac 操作系统 10.10.3RStudio 版本 0.98.1103 我的工作目录是一个包含 332 个 .csv 文件的列表,我的设置是正确的。这是代码: pollutantmean <-
我在 coursera 上的 scala 中参加了 martin odersky 的函数式编程类(class)。 但是,我无法理解第二个作业 Funsets.scala 的解决方案。 type Set
我正在上一门算法课,现在我们正在学习贪婪算法。我的两个解决方案在某些测试用例上输出“未知信号 11”。 但是,我用尽可能大的输入将我的程序推向了极限。它在我的电脑上运行得很好。然而,在 Courser
我在 Coursera 上问了这个问题,但没有人回复,所以我来到这里。这是关于 Scala 函数式编程原理类(class)的最后一个作业(Anagrams)。 如果函数减法返回无序出现,Anagram
我想通过这些链接后面的程序(主要是 Python)提取 Coursera 视频下载链接 https://www.coursera.org/learn/human-computer-interactio
我正在使用 Coursera 的 jupyterNotebook,但没有办法将所有内容恢复到开头。 唯一相关的选项似乎是“恢复到检查点”——但我一开始没有保存检查点。 这是否意味着我无法恢复到它? 最
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 2个月前关闭。 Improve th
我正在尝试从 OS X Mavericks 上的命令行运行 coursera-dl。 控制台输出如下: $ coursera-dl Traceback (most recent ca
来自那门类(class) https://class.coursera.org/progfun-004/assignment 我下载了 http://spark-public.s3.amazonaws
我目前正在为 coursera 上提供的创业工程类(class)学习 program 2 我正在使用 Amazon Web 服务使用 ubuntu 实例进行编程,但我的编程一直挂起。我的 node.j
在完成“Scala 中的函数式编程原则”@coursera 类(class)第 3 周的作业时,我发现当我实现视频类(class)中所示的函数联合时: override def union(tha
我正在尝试从 Julia 中的 Coursera 进行逻辑回归,但它不起作用。 计算梯度的 Julia 代码: sigmoid(z) = 1 / (1 + e ^ -z) hypotesis(thet
我正在 Coursera 上学习 Andrew Ng 的机器学习,方法是使用 Python 而不是 MATLAB 实现所有代码。 在编程练习 3 中,我以向量化形式实现了正则化逻辑回归成本函数: de
我在理解如何对 Coursera 上提供的机器学习类(class)中的函数进行矢量化时遇到问题。 在类(class)中,Andrew Ng 解释了假设可以向量化为 theta 乘以 x 的转置: H(
我从 MOOC 中学到了很多东西,所以我想为此返回一些东西我正在考虑在 kivy 中设计一个小应用程序,因此需要 python 实现,实际上我想要实现的是记录通过程序进入我的 Coursera 帐户并
任务 -- 此代码问题的目标是实现二分查找算法。 输入格式 -- 输入的第一行包含一个整数 n 和一个序列 a0 &a, long long x) { size_t left = 0, righ
当我尝试在 Angular 中使用 jsonp 方法请求 coursera api 时,出现以下错误。 Refused to execute script from 'https://api.cour
我正在用 C# 实现 Ng 的 OCR 神经网络示例。我认为我已经正确实现了所有公式[矢量化版本],并且我的应用程序正在训练网络。 关于如何看到我的网络在识别方面的改进,有什么建议吗 - 无需在训练完
我已经开始 Coursera Algorythms course .练习作业必须在Java上完成,他们建议使用DrJava作为IDE,但这真的很不方便。所以我想使用 Eclipse,但问题是我无法使用
我正在 coursera java 类(class)中做作业。作业是关于java中的统计数据,他们给了我一些文件,其中包含每个名字的出生数量,并想要每个名字的排名,例如hesham 15,ahmed
我是一名优秀的程序员,十分优秀!