- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
为什么要关闭并重新打开 MATLAB 窗 Eloquent 能再次运行神经网络才能得到相同的结果?哪些参数在此过程中有效?
编辑(有关我的问题的更多详细信息)如果我不关闭 MATLAB 的所有窗口,也不重新打开它们来运行另一个网络(例如由其他数量的神经元运行),则每次关闭并重新打开窗口时获得的结果都会有所不同。例如:我通过隐藏层中的 5 个神经元运行 ANN 并得到 R(1)=0.97,然后我关闭并重新打开我的 m.file 并通过 5 个神经元运行并得到 R(2)=0.58。现在,如果我不关闭也不重新打开,我可能会得到 R(1)=0.99 和 R(2)=0.7(R 是回归)。哪些参数有效,可以使这些答案有所不同?
我的代码如下:
clc
clear
for m=6:7
% P is input matrix for training
% T is output matrix
[Pn,minP,maxP,Tn,minT,maxT] = premnmx(P,T);
net=newff(minmax(Pn),[m,1],{'logsig','purelin'},'trainlm');
net.trainParam.show =100;
net.trainParam.lr = 0.09;
net.trainParam.epochs =1000;
net.trainParam.goal = 1e-3;
[net,tr]=train(net,Pn,Tn);
diff= sim(net,Pn);
diff1 = postmnmx(diff,minT,maxT)
%testing===================================================================
[Pn,minP,maxP,Tn,minT,maxT] = premnmx(P,T);
% Pt is input matrix data for testing
% Tt is output matrix data for testing
Ptn = tramnmx(Pt,minP,maxP)
diff= sim(net,Ptn);
diff2 = postmnmx(diff,minT,maxT)
msetr=mse(diff1-T)
msets=mse(diff2-Tt)
y=(1/n)*sum(diff2); % n is number of testing data
R2=((sum((Tt-y).^2))-(sum((diff2-Tt).^2)))/(sum((Tt-y).^2))
net.IW{1,1}=zeros(m,5);
net.LW{2,1}=zeros(2,m);
net.b{1,1}=zeros(m,1);
net.b{2,1}=zeros(2,1);
end
当我运行它时,每个神经元数量的答案与我不使用“for.. end”循环并通过重新打开 m 文件和 MATLAB 窗口来运行每个神经元数量的时间不同。但是我给权重赋予零值,并没有解决我的问题。
最佳答案
我不太清楚Matlab窗口是什么意思,但是你可以通过输入来控制nntraintool GUI的弹出(nntraintool('close')
)
yournet.trainParam.showWindow = false;
yournet.trainParam.showCommandLine = false;
在网络 yournet
的定义之后、训练函数之前。
编辑:我对OP编辑的回复我根据你的代码附上了我的训练和测试代码,我尝试学习y = x.^2
,并且我的训练数据是x的[1,3,5,7,9]
和 [2,4,6,8] 用于测试。但我应该说,即使初始权重全部为零,我每次都会得到不同的权重。这意味着给定 6 个或 7 个隐藏层节点,反向传播将无法获得唯一的解决方案。请参阅下面我的修改:
clc
clear
for m=6:7
% P is input matrix for training
% T is output matrix
P=[1 3 5 7 9];
T=P.^2;
[Pn,minP,maxP,Tn,minT,maxT] = premnmx(P,T);
clear net
net.IW{1,1}=zeros(m,1);
net.LW{2,1}=zeros(1,m);
net.b{1,1}=zeros(m,1);
net.b{2,1}=zeros(1,1);
net=newff(minmax(Pn),[m,1],{'logsig','purelin'},'trainlm');
net.trainParam.show =100;
net.trainParam.lr = 0.09;
net.trainParam.epochs =1000;
net.trainParam.goal = 1e-3;
[net,tr]=train(net,Pn,Tn);
diff= sim(net,Pn);
diff1 = postmnmx(diff,minT,maxT)
%testing===================================================================
[Pn,minP,maxP,Tn,minT,maxT] = premnmx(P,T);
% Pt is input matrix data for testing
% Tt is output matrix data for testing
Pt=[2 4 6 8];
Tt=Pt.^2;
n=length(Pt);
Ptn = tramnmx(Pt,minP,maxP)
diff= sim(net,Ptn);
diff2 = postmnmx(diff,minT,maxT)
msetr=mse(diff1-T)
msets=mse(diff2-Tt)
y=(1/n)*sum(diff2); % n is number of testing data
R2=((sum((Tt-y).^2))-(sum((diff2-Tt).^2)))/(sum((Tt-y).^2))
end
实际上如果你添加
aa=net.LW(2,1);
aa{1}
就在之前
[net,tr]=train(net,Pn,Tn);
你会发现每次运行时权重都不一样。 Matlab 神经网络工具箱结果不同的原因有两个:(1) 随机数据划分和(2) 随机权重初始化。即使每次避免 (2) 时都将初始权重归零,(1) 仍然存在,因为 dividerand
随机化了输入/目标对的顺序。
解决这个问题的一个技巧是记录第一次的重量。就我而言,我添加了:
bb = [ -0.2013 -0.8314 0.4717 0.4266 0.1441 -0.6205];
net.LW{2,1} = bb;
bbb = [-16.7956 -16.8096 16.8002 16.8001 -16.8101 -16.8416]';
net.IW{1}=bbb;
bbbb=0.2039;
bbbbb=[-16.8044 -10.0608 3.3530 -3.3563 -10.0588 -16.7584]';
net.b{1}=bbbbb;
net.b{2}=bbbb;
在[net,tr]=train(net,Pn,Tn);
之前,结果不会改变。您可能需要根据自己的情况记录 net.b
、net.IW
和 net.LW
值并使用它们每次在循环中(保存
第一次试运行的net
,并加载net
以获取net.b的值
、net.IW
和 net.LW
在循环运行中)。
但我认为这种方法没有多大意义。我强烈建议您:
初始化兰特权重。
使用指定隐藏节点数量的外循环,m
使用一个内部循环,为每个 m 创建一个具有一组新的随机初始权重的网络;然后训练、评估 R2 并将其存储在二维矩阵中。
在存储的结果中搜索性能可接受的最小网络,记录m
。
使用确定的 m
值在循环中运行多次,并仅存储当前最佳设计的索引或权重。
选择性能最佳的权重
关于matlab - 即使初始权重全为零,Matlab 中的神经网络工具箱每次都会得到不同的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20772089/
在 C# 及其同类语言中,我们总是使用 public string SomeString { get; set;} 但是你也可以使用(我最近才发现这个,而且是在和编译器闲逛的时候发现的) public
我已经为 Controller 中的函数编写了 Swagger 注释,但在生成 swagger-ui 代码时出现错误。以下是我的注释代码 /*** End of Annotation For dele
我正在 PHP 中开发一项服务,该服务使用 exec 函数调用 jar 文件,如下所示: $text = "string with accents á, ó, ú or العربية"; exec(
我正在尝试了解有关在程序中利用/防止缓冲区溢出的方法的更多信息。我知道如果大小是恒定的,下面的代码很容易受到攻击,但是如果大小每次都是随机的怎么办?是否还有办法从堆栈中获取它并以某种方式动态改变溢出字
对于一项学校作业,我应该制作一个可以以小时、分钟和秒为单位存储时间的时间类。一切正常,但仅声明 get 时属性总是返回 0;并设置; private int seconds, minutes, hou
我正在遍历一些测验对象并将结果存储到json变量中。出现"ReferenceError is not defined"错误,不确定原因。 JS代码 // This function will send
使用 Nifi 的 PutDatabaseRecord 处理器在 MySQL 中插入阿拉伯字符(非拉丁语)时,字符被“??????”替换 插入后,阿拉伯字符串被替换为??????。我已经使用 utf8
谁能告诉我为什么 gets(abc) 使用 char[] 而不是使用 int? int abc; char name[] = "lolrofl"; printf("Hello %s.\n",na
为什么在使用 as.POSIXct 转换下面的时间戳时得到所有 NA? > head(tmp$timestamp_utc) [1] Fri Jul 03 00:15:00 EDT 2015 Fri J
def get_submultiples(n): # Get all submultiples of n if n == 1: return [1] i = 2
有没有办法访问基本模型的实际 child ,意思是:继续使用 django Docs 中的示例,让我们假设我正在建模不同的外卖餐厅,它们只是有共同点 姓名 都有deliver方法 至此: class
我正在寻找一个范围的总和,但我总是得到“未定义”。我相信有些东西出现在错误的位置,但我不确定它是什么。 第 1 部分:“编写一个范围函数,它接受两个参数(start 和 end),并返回一个包含从 s
我已将 spring 版本从 4.2.3 更新到 5.0.2,并将安全性从 5.0.1 更新到 5.0.10 并使用 spring -flex版本1.6.0.RC1。 像这样使用 BlazeDS 依赖
我可以输入但在输出中,我得到的结果为零。我使用两门类(class),一门是主要的,是日志,另一门是成绩计算。在成绩计算器中,我编写了方法和构造函数,在日志中,类通过构造函数调用这些方法。 import
我在使用 go 时遇到了构建问题。我想知道这是编译器中的错误还是代码的问题。 // removed the error handling for sake of clarity file, _ :=
我的角色在与盒子互动时出现问题。我有一个 GameObject Player 附加了一个脚本来与游戏中的盒子交互,脚本是: using UnityEngine; using System.Collec
有谁知道为什么我不能在下面生成百分比 codeIshere (第 97-117 行)? var format=d3.format(".1%"); var percent = format(functi
我正在尝试编写图像识别代码,以针对不同动物图像训练系统,这就是代码。我使用 anaconda 作为解释器,使用pycharm作为环境。 import tensorflow as tf import o
我正在尝试在 Java 中初始化 Matcher,但无论字符串是否已初始化且不为 null,都会继续获取 NPE。 这是代码: pattern.compile("\\s"); System.out.p
所以我有这段代码: ; (function (g) { var d = document, i, am = d.createElement('script'), h = d.head || d.g
我是一名优秀的程序员,十分优秀!