backpropagation - 使用反向传播算法实现感知器-6ren

backpropagation - 使用反向传播算法实现感知器

转载作者：行者123 更新时间：2023-12-04 20:18:32

25

4

我正在尝试使用反向传播实现两层感知器来解决奇偶校验问题。该网络有 4 个二进制输入，第一层有 4 个隐藏单元，第二层有 1 个输出。我正在使用 this供引用，但在收敛方面有问题。

首先，我会注意到我使用 sigmoid 函数进行激活，因此导数是(据我所知)sigmoid(v) * (1 - sigmoid(v))。因此，在计算 delta 值时会使用它。

所以，基本上我设置了网络并运行了几个时期(遍历每个可能的模式——在这种情况下，有 16 种输入模式)。在第一个 epoch 之后，权重略有变化。在第二个之后，无论我运行多少个时代，权重都不会改变并保持不变。我现在使用 0.1 的学习率和 +1 的偏差。

训练网络的过程如下伪代码(根据我检查过的来源，我认为这是正确的):

前馈步骤:

v = SUM[weight connecting input to hidden * input value] + bias  
y = Sigmoid(v)  
set hidden.values to y  
v = SUM[weight connecting hidden to output * hidden value] + bias  
y = Sigmoid(v)  
set output value to y

输出层的反向传播:

error = desired - output.value  
outputDelta = error * output.value * (1 - output.value)

隐藏层的反向传播:

for each hidden neuron h:  
error = outputDelta * weight connecting h to output  
hiddenDelta[i] = error * h.value * (1 - h.value)

更新权重:

for each hidden neuron h connected to the output layer  
h.weight connecting h to output = learningRate * outputDelta * h.value

for each input neuron x connected to the hidden layer  
x.weight connecting x to h[i] = learningRate * hiddenDelta[i] * x.value

这个过程当然会循环遍历各个时期，并且权重变化持续存在。所以，我的问题是，是否有任何原因使第二个时代之后权重保持不变？如果有必要，我可以发布我的代码，但目前我希望有一些我忽略的明显的东西。谢谢大家!

编辑:这是 sarnold 建议的指向我的代码的链接:
MLP.java: http://codetidy.com/1903
Neuron.java: http://codetidy.com/1904
模式.java: http://codetidy.com/1905
输入.txt: http://codetidy.com/1906

最佳答案

我想我发现了问题；有趣的是，我发现的内容在您的高级描述中可见，但我只发现代码中看起来很奇怪的内容。一、说明:

for each hidden neuron h connected to the output layer
h.weight connecting h to output = learningRate * outputDelta * h.value

for each input neuron x connected to the hidden layer
x.weight connecting x to h[i] = learningRate * hiddenDelta[i] * x.value

相信 h.weight应该相对于之前的权重进行更新。您的更新机制仅根据学习率、输出增量和节点值来设置它。同样， x.weight还根据学习率、隐藏增量和节点值进行设置:

    /*** Weight updates ***/

    // update weights connecting hidden neurons to output layer
    for (i = 0; i < output.size(); i++) {
        for (Neuron h : output.get(i).left) {
            h.weights[i] = learningRate * outputDelta[i] * h.value;
        }
    }

    // update weights connecting input neurons to hidden layer
    for (i = 0; i < hidden.size(); i++) {
        for (Neuron x : hidden.get(i).left) {
            x.weights[i] = learningRate * hiddenDelta[i] * x.value;
        }
    }

我不知道正确的解决方案是什么；但我有两个建议:

替换这些行:

        h.weights[i] = learningRate * outputDelta[i] * h.value;
        x.weights[i] = learningRate * hiddenDelta[i] * x.value;

用这些行:

        h.weights[i] += learningRate * outputDelta[i] * h.value;
        x.weights[i] += learningRate * hiddenDelta[i] * x.value;

( += 而不是 = 。)

替换这些行:

        h.weights[i] = learningRate * outputDelta[i] * h.value;
        x.weights[i] = learningRate * hiddenDelta[i] * x.value;

用这些行:

        h.weights[i] *= learningRate * outputDelta[i];
        x.weights[i] *= learningRate * hiddenDelta[i];

(忽略该值并简单地缩放现有权重。对于此更改，学习率应为 1.05 而不是 .05。)

关于backpropagation - 使用反向传播算法实现感知器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9169280/

25

4

0

文章推荐： WPF 错误模板未显示

文章推荐： excel - 获取 Worksheet_change 事件自动执行宏

文章推荐： excel - 公式不会自动计算

文章推荐： svn - XCode 7 源代码管理提交失败

java - @Transactional(传播=传播。需要)
如果有人能解释这个注释的作用以及我们何时使用它: @Transactional(propagation=Propagation.REQUIRED) 谢谢最佳答案如果您需要在 Spring Docs
Javascript - 阻止模态键盘事件冒泡/传播
我有一个页面，它有一个 keydown 事件监听器，用于监听 Escape 键，以便返回。我还有一个简单的模态类，它也监听 Escape 键以关闭它。主页监听器检查模式是否打开，如果打开，则不执行任何
Modelica 传播/默认变量名
我想在模型中设置默认变量名称 T (=xx) - 将该模型拖到新模型中并在其中定义变量 xx。我收到错误消息:使用未声明的变量 xx。这是子模型 model test parameter Rea
jqueryMobile 水龙头和冒泡/传播
在 android 2.x 浏览器中查看此示例..它是在我的应用程序中复制场景的示例.. http://johnchacko.net/samples/tap.html 它是关于监听“tap”并从监听器
C# 捕获特定异常类型的重新抛出/传播
如您所见，我正在尝试将 GatewayConnectionFailedException 传播到我的 UI。我希望此代码捕获除异常之外的所有内容，我希望表示层捕获该异常以通知用户数据库是问题所在，以便
CMake 静态库依赖项不随 ExternalProject_Add 传播
我目前正在尝试让可执行文件与它需要的所有依赖项正确链接。这是依赖项的示例结构: exe -> libA -> libB exe和 libA有自己的存储库。 exe拉入libA像这样的东西: add_
scala - Scala中的“传播”参数？
有什么方法可以调用带有单个参数的 Scala 函数，给定一个数组 (类似于 JavaScript Spreads在 ECMAScript 6) 中？ ys = [10.0, 2.72, -3.14]
Cmake:包含目录的 target_link_libraries 传播
我有一个小型静态库，它需要 boost 头文件，并且需要包含目录中的“include”目录。 ... add_library(alib STATIC ...) target_include_direc
javascript - 传播 Promise 并在新对象中扩展
我有一些 promise 可以返回对象。现在我想将它们合并/扩展为一个新对象，因此我使用 Lodash's extend . var whenEverythingIsDone = Promise.a
scala - 传播 Scala 类型参数
这是我认为人们通常希望在 Scala 中做的事情，但如果我能在任何地方找到一个例子，我就该死了。这段代码由于类型删除而无法编译，但它演示了我正在努力完成的事情: def parse[T](json:
scala - 传播 Scala 类型参数
这是我认为人们通常希望在 Scala 中做的事情，但如果我能在任何地方找到一个例子，我就该死了。这段代码由于类型删除而无法编译，但它演示了我正在努力完成的事情: def parse[T](json:
Sharepoint default.master 传播？
我们有大量 MOSS 2007 站点需要添加大量的 javascript。我编辑、 checkin 、发布并批准了对 default.master 的更改，更改反射(reflect)在根网站上，但没有
jQuery:函数被调用两次。传播？为什么会出现这种情况？
请看一下下面的 fiddle :http://jsfiddle.net/K9NjY/ 我在这段代码上花了 3-4 个小时，并将其缩小到最短的版本，但现在我陷入了困境。问题:1. 点击“divOne”
java - Spring 集成中的错误处理/传播
我读到如果在流程中抛出异常，框架要做的第一件事就是检查消息头中的错误 channel 属性。总是这样吗？在我的特殊情况下，我将自定义错误 channel 分配给消息 header ，但该消息似乎已向
c++ - 不能通过carry让值(value)传播
创建一个小的 C++ 大型精度类，一切似乎都运行良好，但是添加，如果我将 0xffffffff 和 0x04 加在一起，我会得到 0xffff0003，而我应该得到 0x0100000003。这是有问
javascript - react : problems with . ..传播
我正在尝试重新创建 Dan Abramov 类(class)中的 Redux 示例。传播{...store.getState()}在应用程序级别不起作用，Redux 正在更改状态并且 React 不会
mysql - 传播.REQUIRES_NEW 锁定
考虑一个需要很长时间的事务。在此期间，我想对 TableSmall 执行一些小更新。，它应该立即执行，并且主事务的回滚不应该回滚那些小的更新。我当前的问题是这些小更新将锁定 TableSmall\
c - 如何处理子函数中的 const 传播
我需要对现有函数进行修改，具有一些 const 输入参数: int f(const owntype *r1, const owntype *r2) 为了做到这一点，我想调用一个使用相同类型但没有 co
c# - 传播 DependencyProperty 默认值
我有一个带有 ViewModel 的 WPF UserControl: 这个 UserControl 有一个 De
android - 停止 SMS 传播
我试图在收到这样的短信时不传播 public class SMSReceiver extends BroadcastReceiver { @Override public void onRec

首页

博学

6Ren·AI

商城

backpropagation - 使用反向传播算法实现感知器