作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在 python 中使用前馈神经网络 pybrain执行。对于训练,我将使用反向传播算法。我知道,对于神经网络,我们需要拥有适量的数据,以免网络训练不足/过度。我可以获得大约 1200 个不同的数据集训练数据模板。
那么问题来了:
如何计算训练的最佳数据量?
由于我尝试了数据集中的 500 个项目,并且花了很多小时才收敛,所以我不想尝试太多的大小。我们对最后一个尺寸的结果非常满意,但我想找到最佳的数量。该神经网络大约有 7 个输入、3 个隐藏节点和 1 个输出。
最佳答案
How do I calculate the optimal amount of data for my training?
它完全依赖于解决方案。还有一点艺术与科学的结合。了解您是否进入过度拟合区域的唯一方法是定期针对一组验证数据(即您未使用的数据进行训练)测试您的网络。当该组数据的性能开始下降时,您可能训练得太远了——回滚到最后一次迭代。
The results were quite good with this last size but I would like to find the optimal amount.
“最优”不一定是可能的;这也取决于你的定义。您通常需要的是高度的信心,即一组给定的权重在未见过的数据上表现“良好”。这就是验证集背后的想法。
关于artificial-intelligence - 用于前馈神经网络训练的有效数据集大小,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4100785/
我是一名优秀的程序员,十分优秀!