artificial-intelligence - 有人可以解释一下人工神经网络吗？-6ren

artificial-intelligence - 有人可以解释一下人工神经网络吗？

转载作者：行者123 更新时间：2023-11-30 08:24:36

根据Wikipedia (我知道这是一个不好的来源)神经网络由以下部分组成

A 神经元的输入层
多个 (B) 隐藏层，每个隐藏层由 C 神经元组成。
“D”神经元的输出层。

我明白输入层和输出层的含义。

我的问题是如何确定最佳的层数和每层神经元数量？

增加“B”的优点/缺点是什么？
增加“C”的优点/缺点是什么？
增加“B”与“C”有什么区别？

这仅仅是时间量(处理能力的限制)还是使网络更深会限制结果的质量，我应该更多地关注深度(更多层)还是广度(每层更多神经元)？

最佳答案

答案 1. 一层将模拟大多数问题，或者最多可以使用两层。

答案 2。如果使用的神经元数量不足，网络将无法对复杂数据进行建模，并且最终拟合效果会很差。如果使用太多神经元，训练时间可能会变得过长，更糟糕的是，网络可能会过度拟合数据。当发生过度拟合$时，网络将开始对数据中的随机噪声进行建模。结果是该模型非常适合训练数据，但对于新的、未见过的数据的泛化能力很差。必须使用验证来测试这一点。

$什么是过度拟合？

在统计学中，当统计模型描述随机误差或噪声而不是潜在关系时，就会发生过度拟合。当模型过于复杂时，通常会发生过度拟合，例如相对于观测值数量而言，参数过多。过度拟合的模型通常预测性能较差，因为它可能会夸大数据中的微小波动。过度拟合的概念在机器学习中很重要。通常，学习算法是使用一组训练示例进行训练的，即已知所需输出的示例情况。假设学习器达到了一种状态，它也能够预测其他示例的正确输出，从而泛化到训练期间未出现的情况(基于其归纳偏差)。然而，特别是在学习时间过长或训练示例很少的情况下，学习器可能会调整训练数据的非常具体的随机特征，这些特征与目标函数没有因果关系。在这个过拟合的过程中，训练样本上的性能仍然提高，而在未见过的数据上的性能却变得更差。

答案 3。阅读答案 1 和 2。

维基百科上的监督学习文章 (http://en.wikipedia.org/wiki/Supervised_learning) 将使您更深入地了解对于包括神经网络在内的任何监督学习系统而言，哪些因素非常重要。文章讨论了输入空间的维数、训练数据量、噪声等。

关于artificial-intelligence - 有人可以解释一下人工神经网络吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9558384/