matlab - 即使初始权重全为零，Matlab 中的神经网络工具箱每次都会得到不同的结果-6ren

matlab - 即使初始权重全为零，Matlab 中的神经网络工具箱每次都会得到不同的结果

转载作者：行者123 更新时间：2023-11-30 09:23:45

24

4

为什么要关闭并重新打开 MATLAB 窗 Eloquent 能再次运行神经网络才能得到相同的结果？哪些参数在此过程中有效？

编辑(有关我的问题的更多详细信息)如果我不关闭 MATLAB 的所有窗口，也不重新打开它们来运行另一个网络(例如由其他数量的神经元运行)，则每次关闭并重新打开窗口时获得的结果都会有所不同。例如:我通过隐藏层中的 5 个神经元运行 ANN 并得到 R(1)=0.97，然后我关闭并重新打开我的 m.file 并通过 5 个神经元运行并得到 R(2)=0.58。现在，如果我不关闭也不重新打开，我可能会得到 R(1)=0.99 和 R(2)=0.7(R 是回归)。哪些参数有效，可以使这些答案有所不同？

我的代码如下:

clc
clear
for m=6:7

   % P is input matrix for training
   % T is output matrix 

   [Pn,minP,maxP,Tn,minT,maxT] = premnmx(P,T);

   net=newff(minmax(Pn),[m,1],{'logsig','purelin'},'trainlm');

   net.trainParam.show =100;
   net.trainParam.lr = 0.09;
   net.trainParam.epochs =1000;
   net.trainParam.goal = 1e-3; 

   [net,tr]=train(net,Pn,Tn);
   diff= sim(net,Pn);
   diff1 = postmnmx(diff,minT,maxT)

   %testing===================================================================
   [Pn,minP,maxP,Tn,minT,maxT] = premnmx(P,T);
   % Pt is input matrix data for testing 
   % Tt is output matrix data for testing

   Ptn = tramnmx(Pt,minP,maxP)
   diff= sim(net,Ptn);
   diff2 = postmnmx(diff,minT,maxT)

   msetr=mse(diff1-T)
   msets=mse(diff2-Tt)

   y=(1/n)*sum(diff2); % n is number of testing data
   R2=((sum((Tt-y).^2))-(sum((diff2-Tt).^2)))/(sum((Tt-y).^2))

   net.IW{1,1}=zeros(m,5);
   net.LW{2,1}=zeros(2,m);
   net.b{1,1}=zeros(m,1);
   net.b{2,1}=zeros(2,1);

end

当我运行它时，每个神经元数量的答案与我不使用“for.. end”循环并通过重新打开 m 文件和 MATLAB 窗口来运行每个神经元数量的时间不同。但是我给权重赋予零值，并没有解决我的问题。

最佳答案

我不太清楚Matlab窗口是什么意思，但是你可以通过输入来控制nntraintool GUI的弹出(nntraintool('close'))

yournet.trainParam.showWindow = false;
yournet.trainParam.showCommandLine = false;

在网络 yournet 的定义之后、训练函数之前。

编辑:我对OP编辑的回复我根据你的代码附上了我的训练和测试代码，我尝试学习y = x.^2，并且我的训练数据是x的[1,3,5,7,9] 和 [2,4,6,8] 用于测试。但我应该说，即使初始权重全部为零，我每次都会得到不同的权重。这意味着给定 6 个或 7 个隐藏层节点，反向传播将无法获得唯一的解决方案。请参阅下面我的修改:

clc
clear

for m=6:7

   % P is input matrix for training
   % T is output matrix 
   P=[1 3 5 7 9];
   T=P.^2;
   [Pn,minP,maxP,Tn,minT,maxT] = premnmx(P,T);
   clear net
   net.IW{1,1}=zeros(m,1);
   net.LW{2,1}=zeros(1,m);
   net.b{1,1}=zeros(m,1);
   net.b{2,1}=zeros(1,1);
   net=newff(minmax(Pn),[m,1],{'logsig','purelin'},'trainlm');

   net.trainParam.show =100;
   net.trainParam.lr = 0.09;
   net.trainParam.epochs =1000;
   net.trainParam.goal = 1e-3; 

   [net,tr]=train(net,Pn,Tn);
   diff= sim(net,Pn);
   diff1 = postmnmx(diff,minT,maxT)

   %testing===================================================================
   [Pn,minP,maxP,Tn,minT,maxT] = premnmx(P,T);
   % Pt is input matrix data for testing 
   % Tt is output matrix data for testing
   Pt=[2 4 6 8];
   Tt=Pt.^2;
   n=length(Pt);
   Ptn = tramnmx(Pt,minP,maxP)
   diff= sim(net,Ptn);
   diff2 = postmnmx(diff,minT,maxT)

   msetr=mse(diff1-T)
   msets=mse(diff2-Tt)

   y=(1/n)*sum(diff2); % n is number of testing data
   R2=((sum((Tt-y).^2))-(sum((diff2-Tt).^2)))/(sum((Tt-y).^2))


end

实际上如果你添加

aa=net.LW(2,1);
aa{1}

就在之前

[net,tr]=train(net,Pn,Tn);

你会发现每次运行时权重都不一样。 Matlab 神经网络工具箱结果不同的原因有两个:(1) 随机数据划分和(2) 随机权重初始化。即使每次避免 (2) 时都将初始权重归零，(1) 仍然存在，因为 dividerand 随机化了输入/目标对的顺序。

解决这个问题的一个技巧是记录第一次的重量。就我而言，我添加了:

   bb = [ -0.2013   -0.8314    0.4717    0.4266    0.1441   -0.6205];
   net.LW{2,1} = bb;
   bbb = [-16.7956 -16.8096 16.8002 16.8001 -16.8101 -16.8416]';
   net.IW{1}=bbb;
   bbbb=0.2039;
   bbbbb=[-16.8044 -10.0608 3.3530 -3.3563 -10.0588 -16.7584]';
   net.b{1}=bbbbb;
   net.b{2}=bbbb;

在[net,tr]=train(net,Pn,Tn);之前，结果不会改变。您可能需要根据自己的情况记录 net.b、net.IW 和 net.LW 值并使用它们每次在循环中(保存第一次试运行的net，并加载net以获取net.b的值、net.IW 和 net.LW 在循环运行中)。

但我认为这种方法没有多大意义。我强烈建议您:

初始化兰特权重。
使用指定隐藏节点数量的外循环，m
使用一个内部循环，为每个 m 创建一个具有一组新的随机初始权重的网络；然后训练、评估 R2 并将其存储在二维矩阵中。
在存储的结果中搜索性能可接受的最小网络，记录m。
使用确定的 m 值在循环中运行多次，并仅存储当前最佳设计的索引或权重。
选择性能最佳的权重

关于matlab - 即使初始权重全为零，Matlab 中的神经网络工具箱每次都会得到不同的结果，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20772089/

24

4

0

文章推荐： machine-learning - 谱聚类中的度矩阵

文章推荐： Javascript 正则表达式括号子匹配数组

文章推荐： javascript - 我是否正确更新了 React 状态？

c# - 使用{设置;得到;}而不是{得到;放;}
在 C# 及其同类语言中，我们总是使用 public string SomeString { get; set;} 但是你也可以使用(我最近才发现这个，而且是在和编译器闲逛的时候发现的) public
php - Laravel Swagger 得到 [语法错误] 预期值，得到 '@'
我已经为 Controller 中的函数编写了 Swagger 注释，但在生成 swagger-ui 代码时出现错误。以下是我的注释代码 /*** End of Annotation For dele
java - 得到??通过php代码调用jar文件时的字符
我正在 PHP 中开发一项服务，该服务使用 exec 函数调用 jar 文件，如下所示: $text = "string with accents á, ó, ú or العربية"; exec(
c - 随机大小缓冲区的缓冲区溢出？ (得到)
我正在尝试了解有关在程序中利用/防止缓冲区溢出的方法的更多信息。我知道如果大小是恒定的，下面的代码很容易受到攻击，但是如果大小每次都是随机的怎么办？是否还有办法从堆栈中获取它并以某种方式动态改变溢出字
c# - 得到;不能正常工作
对于一项学校作业，我应该制作一个可以以小时、分钟和秒为单位存储时间的时间类。一切正常，但仅声明 get 时属性总是返回 0；并设置； private int seconds, minutes, hou
javascript - 得到“未定义ReferenceError”
我正在遍历一些测验对象并将结果存储到json变量中。出现"ReferenceError is not defined"错误，不确定原因。 JS代码 // This function will send
mysql - 得到？？？通过Nifi将非拉丁数据放入mysql时
使用 Nifi 的 PutDatabaseRecord 处理器在 MySQL 中插入阿拉伯字符(非拉丁语)时，字符被“？？？？？？”替换插入后，阿拉伯字符串被替换为??????。我已经使用 utf8
c++ - 得到(变量)
谁能告诉我为什么 gets(abc) 使用 char[] 而不是使用 int？ int abc; char name[] = "lolrofl"; printf("Hello %s.\n",na
r as.POSIXct 得到 NA
为什么在使用 as.POSIXct 转换下面的时间戳时得到所有 NA？ > head(tmp$timestamp_utc) [1] Fri Jul 03 00:15:00 EDT 2015 Fri J
python - 得到 n 的所有约数的这个算法的运行时间复杂度是多少？
def get_submultiples(n): # Get all submultiples of n if n == 1: return [1] i = 2
Django 模型继承 - 得到 child
有没有办法访问基本模型的实际 child ，意思是:继续使用 django Docs 中的示例，让我们假设我正在建模不同的外卖餐厅，它们只是有共同点姓名都有deliver方法至此: class
javascript - 范围总和---得到 "undefined"
我正在寻找一个范围的总和，但我总是得到“未定义”。我相信有些东西出现在错误的位置，但我不确定它是什么。第 1 部分:“编写一个范围函数，它接受两个参数(start 和 end)，并返回一个包含从 s
java - 得到 JdkVersion classNotFoundException
我已将 spring 版本从 4.2.3 更新到 5.0.2，并将安全性从 5.0.1 更新到 5.0.10 并使用 spring -flex版本1.6.0.RC1。像这样使用 BlazeDS 依赖
java - 得到 0 输出而不是正确的输出
我可以输入但在输出中，我得到的结果为零。我使用两门类(class)，一门是主要的，是日志，另一门是成绩计算。在成绩计算器中，我编写了方法和构造函数，在日志中，类通过构造函数调用这些方法。 import
go - 构建时出错，得到 : "suspect or "
我在使用 go 时遇到了构建问题。我想知道这是编译器中的错误还是代码的问题。 // removed the error handling for sake of clarity file, _ :=
c# - 尝试与光线转换命中的对象上的组件进行交互，得到 NullReferenceException
我的角色在与盒子互动时出现问题。我有一个 GameObject Player 附加了一个脚本来与游戏中的盒子交互，脚本是: using UnityEngine; using System.Collec
javascript - 无法可视化百分比数字(得到 NaN)
有谁知道为什么我不能在下面生成百分比 codeIshere (第 97-117 行)？ var format=d3.format(".1%"); var percent = format(functi
python - 需要整数参数，得到 float
我正在尝试编写图像识别代码，以针对不同动物图像训练系统，这就是代码。我使用 anaconda 作为解释器，使用pycharm作为环境。 import tensorflow as tf import o
java - 使用初始化的字符串初始化匹配器，得到 NullPointerException
我正在尝试在 Java 中初始化 Matcher，但无论字符串是否已初始化且不为 null，都会继续获取 NPE。这是代码: pattern.compile("\\s"); System.out.p
javascript语法错误预期表达式，得到 '<'
所以我有这段代码: ; (function (g) { var d = document, i, am = d.createElement('script'), h = d.head || d.g

首页

博学

6Ren·AI

商城

matlab - 即使初始权重全为零，Matlab 中的神经网络工具箱每次都会得到不同的结果