machine-learning - 神经网络 : What does the input layer consist of?-6ren

machine-learning - 神经网络 : What does the input layer consist of?

转载作者：行者123 更新时间：2023-11-30 08:26:29

24

4

最终编辑:清理问题并接受 runDOSrun 的答案。 IVlad 的同样好，user3760780 的也非常有帮助。我建议阅读所有这三篇文章以及评论。 TLDR 的答案是，可能性#1 或多或少是正确的，但我的措辞非常糟糕。

神经网络中的输入层由什么组成？该层有什么作用？

类似的问题在这里Neural Networks: Does the input layer consist of neurons?但那里的答案并没有消除我的困惑。

就像上面问题中的发帖者一样，我对互联网上关于基本前馈网络的输入层的许多相互矛盾的说法感到困惑。

我将跳过相互矛盾的教程和文章的链接，并列出我可以看到的三种可能性。哪一项(如果有)是正确的？

输入层将数据直接传递到第一个隐藏层，其中数据将乘以第一个隐藏层的权重。
输入层在传递数据之前先通过激活函数。然后将数据乘以第一个隐藏层的权重。
输入层有自己的权重，用于乘以传入数据。然后，输入层将数据通过激活函数，然后再传递。然后将数据乘以第一个隐藏层的权重。

谢谢!

编辑 1:为了进一步清晰起见，这是一张图像和一个示例。

最佳答案

在您的 3 个描述中，第一个最适合:

The input layer passes the data directly to the first hidden layer where the data is multiplied by the first hidden layer's weights.

标准多层感知器的输入层由单元组成(您可以将它们称为输入神经元，但我更喜欢使用术语单元，因为您期望神经元执行一些计算，但输入层的情况并非如此)您分配一个值(输入数据实例的一部分，或者机器学习术语中单个实例的特征值)，它们只是将该值提供给第一个隐藏层中的每个神经元，从而准确地产生您在图像中描绘的第一个案例。

为了更准确，我会将其改写为:

输入层的每个单元按照从上到下的顺序将其分配的值传递给第一个隐藏层的每个神经元。然后，每个隐藏层神经元将这些值 (x1, x2, ..., xm) 与其权重向量 (w1, w2, ..., wm) 相乘)，对相乘的值 (x1*w1 + x2*w2 + ... + xm*wm) 求和，将其激活函数应用于此总和(logistic、tanh、恒等函数)并返回值由激活函数计算到下一层。

因此，对于您的示例，隐藏层中最顶层的神经元将接收输入:

.5, .6

从输入层，它将计算并返回:

g(.4 * .5 + .3 * .6)

其中g是它的激活函数，可以是任何东西:

g(x) = x # identity function, like in your picture
g(x) = 1 / (1 + exp(-x)) # logistic sigmoid

在我看来，说权重也进入其中并不完全正确，因为它的权重是它自己的，但我想这种区别不是很重要；这当然不会影响结果。

你必须记住，这都是概念性的。在正确的实现中，您根本不会有任何实际的层，只有一些矩阵乘法。但他们将实现相同的概念。当试图理解某些东西时，您应该从引用基本概念开始。

The input layer passes the data through the activation function before passing it on. The data is then multiplied by the first hidden layer's weights.

这是不正确的，输入层仅返回分配给下一层中每个神经元的一些值。

您在哪里找到了一些引用资料？我很确定这样做不是标准做法。

The input layer has its own weights that multiply the incoming data. The input layer then passes the data through the activation function before passing it on. The data is then multiplied by the first hidden layer's weights.

再说一次，情况并非如此。它没有权重，也没有激活函数。

关于machine-learning - 神经网络 : What does the input layer consist of?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32514502/

24

4

0

文章推荐： machine-learning - 分类和检测之间的区别

文章推荐： r - 对训练数据进行聚类后，如何预测新数据的聚类？

文章推荐： python - SKL学习如何获取 LinearSVC 分类器的决策概率

文章推荐： R - 给定训练集和测试集的训练模型，计算测试 MSE

python - 如何使用Keras API提取权重 "from input layer to hidden layer"和 "from hidden layer to output layer"？
我是 Keras 新手，我正在尝试获取 Keras 中的权重。我知道如何在 Python 中的 Tensorflow 中执行此操作。代码: data = np.array(attributes, '
python - tf.contrib.layer.fully_connected、tf.layers.dense、tf.contrib.slim.fully_connected、tf.keras.layers.Dense 之间的不一致
我正在尝试为上下文强盗问题 (https://medium.com/emergent-future/simple-reinforcement-learning-with-tensorflow-part
javascript - Open Layers 无法读取未定义的属性 'add Layer'
我尝试在单击时向 map 添加新标记，并尝试保存标题和描述以在标记悬停时显示，但出现以下错误: Cannot read property 'add Layer' of undefined Javasc
传单层控制 : select Layer inside Layer Group?
我想要一个传单图层控件，我可以在其中选择一个基础图层，并使这个基础图层本身成为一个 LayerGroup，我可以从中选择要显示的子图层。我正在考虑一个设置，我单击一个单选按钮来选择基础层(层组)，然后
layer - 金普 : To move a layer's position within an image
我在 GIMP Script-fu 和过程浏览器中遇到了一个简单的问题。我正在尝试在具有 40 层的图像中向上/向下移动一个层。让我们调用图像 test.xcf 和所述层 Chromask-snap
javascript - InDesign 脚本错误 : "Expected Layer, but received Layer"
我有一个(非常大的)脚本在 InDesign 中运行，该脚本在某一时刻将库资源放置到页面上，然后将其移动到特定图层。此脚本在我们这里的所有计算机上都运行良好，但仅当当时 InDesign 中没有打开其
tensorflow - 即使我们不使用model.fit，我们什么时候应该继承keras.Model而不是keras.layers.Layer？
在一些使用 tf2 的 Tensorflow 教程(例如 Neural Machine Translation with Attention 和 Eager essentials )中，他们定义了自定
android - “com.layer.atlas:layer-atlas”有什么问题？
现在我无法解决依赖性，怎么了？公司会更改名称吗？但是，我在他们的网站上看到它，但没有“com.layer.atlas:layer-atlas”，但是我的应用程序包含此依赖项，谁能告诉我原因？最佳答
merge - 凯拉斯 : How to merge a dense layer and an embedding layer
我使用 Keras 并尝试将两个不同的层连接成一个向量(向量的第一个值是第一层的值，另一部分是第二层的值)。其中一层是密集层，另一层是嵌入层。我知道如何合并两个嵌入层或两个密集层，但我不知道如何合
python - 如何将 tf.keras.layers.layer 分配给一个类而不初始化它？
我正在开发一个类来创建各种对称 AE。我现在把这个类移植到TF 2.0，比我想象的要复杂。但是，我使用层和模型的子类来实现此目的。因此，我想将多个 keras 层分组为一个 keras 层。但如果我想
ios - layer.addSublayer 与 layer.insertSublayer 动画
我正在为 CAGradient 设置动画 let gradientChangeAnimation = CABasicAnimation(keyPath: "colors") gradientC
PHP 面向对象 : business logic layer - DB layer
什么是使用 OOP 在业务逻辑对象和数据库之间分层的良好设计？最佳答案这些中的任何一个都可以( from Fowler's POEAA ): 数据源架构模式: 表数据网关:充当数据库表网关的对象。
iphone - layer.renderInContext 没有考虑 layer.mask 吗？
我正在尝试将一些 UIImages 渲染成一张我可以保存在我的相册中的图像。但是好像 layer.renderInContext 没有考虑图层蒙版？当前行为:照片保存，我看到了 mosaicLaye
Dojo 构建 profile.layers 还是 profile.dependencies.layers？
哇，这完全令人困惑，而且 dojo 1.8 文档似乎是围绕构建层的完整 clusterf**k。有人知道那里发生了什么吗？在构建脚本示例配置文件中，示例 amd.profile.js 有 profi
spacemacs - `dotspacemacs-configuration-layers' 在 `dotspacemacs/layers' 之外被改变是什么意思？
我的 spacemacs 是 0.200.3@25.1.1 每次启动spacemacs时都会收到警告，如何解决？ Warnings: - dotspacemacs-configuration-laye
computer-science - 有人知道 “layer of abstraction”/“layer of indirection”报价来自哪里吗？
引用是这样的: There's no problem in Computer Science that can't be solved by adding another layer of abstr
python - 当我有自定义图层时，为什么会出现此错误 "The following are legacy tf.layers.Layers"？
我正在使用 Keras 并且有一个自定义层，但是当我使用它时，会发生以下错误，我不知道问题是什么。你能帮我解决这个问题吗？奇怪的是，当我在另一个系统上使用相同的代码时，没有出现此错误! import
tensorflow - Keras:layers.Input 和 layers.InputLayer 有什么区别？
我应该什么时候使用 Input我什么时候应该使用 InputLayer ?在 source code有一个描述，但我不确定它是什么意思。输入层: Layer to be used as an ent
python - 值错误: Please initialize `TimeDistributed` layer with a `Layer` instance
我正在尝试构建一个可以在音频和视频样本上进行训练的模型，但出现此错误 ValueError:请使用“Layer”实例初始化“TimeDistributed”层。您传递了:Tensor("input_1
python - 如何在自定义 tf.keras.layers.Layer 中支持 mask
我正在实现一个需要支持 mask 的自定义 tf.keras.layers.Layer。考虑以下场景 embedded = tf.keras.layer.Embedding(input_dim=vo

首页

博学

6Ren·AI

商城

machine-learning - 神经网络 : What does the input layer consist of?