- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
最终编辑:清理问题并接受 runDOSrun 的答案。 IVlad 的同样好,user3760780 的也非常有帮助。我建议阅读所有这三篇文章以及评论。 TLDR 的答案是,可能性#1 或多或少是正确的,但我的措辞非常糟糕。
神经网络中的输入层由什么组成?该层有什么作用?
类似的问题在这里Neural Networks: Does the input layer consist of neurons?但那里的答案并没有消除我的困惑。
就像上面问题中的发帖者一样,我对互联网上关于基本前馈网络的输入层的许多相互矛盾的说法感到困惑。
我将跳过相互矛盾的教程和文章的链接,并列出我可以看到的三种可能性。哪一项(如果有)是正确的?
谢谢!
编辑 1:为了进一步清晰起见,这是一张图像和一个示例。
最佳答案
在您的 3 个描述中,第一个最适合:
- The input layer passes the data directly to the first hidden layer where the data is multiplied by the first hidden layer's weights.
标准多层感知器的输入层由单元组成(您可以将它们称为输入神经元,但我更喜欢使用术语单元,因为您期望神经元执行一些计算,但输入层的情况并非如此)您分配一个值(输入数据实例的一部分,或者机器学习术语中单个实例的特征值),它们只是将该值提供给第一个隐藏层中的每个神经元,从而准确地产生您在图像中描绘的第一个案例。
为了更准确,我会将其改写为:
x1, x2, ..., xm
) 与其权重向量 (w1, w2, ..., wm
) 相乘),对相乘的值 (x1*w1 + x2*w2 + ... + xm*wm
) 求和,将其激活函数应用于此总和(logistic、tanh、恒等函数)并返回值由激活函数计算到下一层。因此,对于您的示例,隐藏层中最顶层的神经元将接收输入:
.5, .6
从输入层,它将计算并返回:
g(.4 * .5 + .3 * .6)
其中g
是它的激活函数,可以是任何东西:
g(x) = x # identity function, like in your picture
g(x) = 1 / (1 + exp(-x)) # logistic sigmoid
在我看来,说权重也进入其中并不完全正确,因为它的权重是它自己的,但我想这种区别不是很重要;这当然不会影响结果。
你必须记住,这都是概念性的。在正确的实现中,您根本不会有任何实际的层,只有一些矩阵乘法。但他们将实现相同的概念。当试图理解某些东西时,您应该从引用基本概念开始。
- The input layer passes the data through the activation function before passing it on. The data is then multiplied by the first hidden layer's weights.
这是不正确的,输入层仅返回分配给下一层中每个神经元的一些值。
您在哪里找到了一些引用资料?我很确定这样做不是标准做法。
- The input layer has its own weights that multiply the incoming data. The input layer then passes the data through the activation function before passing it on. The data is then multiplied by the first hidden layer's weights.
再说一次,情况并非如此。它没有权重,也没有激活函数。
关于machine-learning - 神经网络 : What does the input layer consist of?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32514502/
我是 Keras 新手,我正在尝试获取 Keras 中的权重。我知道如何在 Python 中的 Tensorflow 中执行此操作。 代码: data = np.array(attributes, '
我正在尝试为上下文强盗问题 (https://medium.com/emergent-future/simple-reinforcement-learning-with-tensorflow-part
我尝试在单击时向 map 添加新标记,并尝试保存标题和描述以在标记悬停时显示,但出现以下错误: Cannot read property 'add Layer' of undefined Javasc
我想要一个传单图层控件,我可以在其中选择一个基础图层,并使这个基础图层本身成为一个 LayerGroup,我可以从中选择要显示的子图层。我正在考虑一个设置,我单击一个单选按钮来选择基础层(层组),然后
我在 GIMP Script-fu 和过程浏览器中遇到了一个简单的问题。 我正在尝试在具有 40 层的图像中向上/向下移动一个层。让我们调用图像 test.xcf 和所述层 Chromask-snap
我有一个(非常大的)脚本在 InDesign 中运行,该脚本在某一时刻将库资源放置到页面上,然后将其移动到特定图层。此脚本在我们这里的所有计算机上都运行良好,但仅当当时 InDesign 中没有打开其
在一些使用 tf2 的 Tensorflow 教程(例如 Neural Machine Translation with Attention 和 Eager essentials )中,他们定义了自定
现在我无法解决依赖性,怎么了? 公司会更改名称吗?但是,我在他们的网站上看到它,但没有“com.layer.atlas:layer-atlas”,但是我的应用程序包含此依赖项,谁能告诉我原因? 最佳答
我使用 Keras 并尝试将两个不同的层连接成一个向量(向量的第一个值是第一层的值,另一部分是第二层的值)。 其中一层是密集层,另一层是嵌入层。 我知道如何合并两个嵌入层或两个密集层,但我不知道如何合
我正在开发一个类来创建各种对称 AE。我现在把这个类移植到TF 2.0,比我想象的要复杂。但是,我使用层和模型的子类来实现此目的。因此,我想将多个 keras 层分组为一个 keras 层。但如果我想
我正在为 CAGradient 设置动画 let gradientChangeAnimation = CABasicAnimation(keyPath: "colors") gradientC
什么是使用 OOP 在业务逻辑对象和数据库之间分层的良好设计? 最佳答案 这些中的任何一个都可以( from Fowler's POEAA ): 数据源架构模式: 表数据网关:充当数据库表网关的对象。
我正在尝试将一些 UIImages 渲染成一张我可以保存在我的相册中的图像。但是好像 layer.renderInContext 没有考虑图层蒙版? 当前行为:照片保存,我看到了 mosaicLaye
哇,这完全令人困惑,而且 dojo 1.8 文档似乎是围绕构建层的完整 clusterf**k。有人知道那里发生了什么吗? 在构建脚本示例配置文件中,示例 amd.profile.js 有 profi
我的 spacemacs 是 0.200.3@25.1.1 每次启动spacemacs时都会收到警告,如何解决? Warnings: - dotspacemacs-configuration-laye
引用是这样的: There's no problem in Computer Science that can't be solved by adding another layer of abstr
我正在使用 Keras 并且有一个自定义层,但是当我使用它时,会发生以下错误,我不知道问题是什么。你能帮我解决这个问题吗?奇怪的是,当我在另一个系统上使用相同的代码时,没有出现此错误! import
我应该什么时候使用 Input我什么时候应该使用 InputLayer ?在 source code有一个描述,但我不确定它是什么意思。 输入层: Layer to be used as an ent
我正在尝试构建一个可以在音频和视频样本上进行训练的模型,但出现此错误 ValueError:请使用“Layer”实例初始化“TimeDistributed”层。您传递了:Tensor("input_1
我正在实现一个需要支持 mask 的自定义 tf.keras.layers.Layer。 考虑以下场景 embedded = tf.keras.layer.Embedding(input_dim=vo
我是一名优秀的程序员,十分优秀!