- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我使用 MATLAB 神经网络工具箱训练了一个神经网络,特别是使用命令 nprtool
,它提供了一个简单的 GUI 来使用工具箱功能,并导出 net
包含有关生成的神经网络信息的对象。
通过这种方式,我创建了一个工作神经网络,我可以将其用作分类器,表示它的图表如下:
有 200 个输入,第一个隐藏层有 20 个神经元,最后一层有 2 个神经元提供二维输出。
我想做的是在其他一些编程语言(C#、Java 等)中使用网络。
为了解决这个问题,我尝试在MATLAB中使用如下代码:
y1 = tansig(net.IW{1} * input + net.b{1});
Results = tansig(net.LW{2} * y1 + net.b{2});
假设 input
是一个包含 200 个元素的一维数组,如果 net.IW{1}
是一个 20x200 矩阵(20 个神经元,200 个权重).
问题是我注意到 size(net.IW{1})
返回了意外的值:
>> size(net.IW{1})
ans =
20 199
我在有 10000 个输入的网络中遇到了同样的问题。在这种情况下,结果不是 20x10000,而是 20x9384(我不记得确切的值)。
那么,问题是:如何获得每个神经元的权重?在那之后,有人可以向我解释如何使用它们来生成与 MATLAB 相同的输出吗?
最佳答案
我解决了上述问题,我认为分享我所学到的东西很有用。
场所
首先,我们需要一些定义。让我们考虑下图,取自 [1]:
上图中,IW代表初始权重:它们代表第1层神经元的权重,每一个都是与每个输入连接,如下图所示[1]:
所有其他权重,称为层权重(第一个图中的LW),它们也与前一层的每个输出相连。在我们的研究案例中,我们使用只有两层的网络,因此我们将只使用一个 LW 数组来解决我们的问题。
问题的解决
经过上面的介绍,我们可以将问题分为两步进行:
A - 强制初始权重的数量与输入数组长度匹配
使用nprtool
,我们可以训练我们的网络,在过程结束时,我们还可以在工作区中导出一些关于整个训练过程的信息。特别是,我们需要导出:
此外,我们还需要生成一个 M 文件,其中包含 MATLAB 用于创建神经网络的代码,因为我们需要修改它并更改一些训练选项。
下图显示了如何执行这些操作:
生成的 M 代码将类似于以下代码:
function net = create_pr_net(inputs,targets)
%CREATE_PR_NET Creates and trains a pattern recognition neural network.
%
% NET = CREATE_PR_NET(INPUTS,TARGETS) takes these arguments:
% INPUTS - RxQ matrix of Q R-element input samples
% TARGETS - SxQ matrix of Q S-element associated target samples, where
% each column contains a single 1, with all other elements set to 0.
% and returns these results:
% NET - The trained neural network
%
% For example, to solve the Iris dataset problem with this function:
%
% load iris_dataset
% net = create_pr_net(irisInputs,irisTargets);
% irisOutputs = sim(net,irisInputs);
%
% To reproduce the results you obtained in NPRTOOL:
%
% net = create_pr_net(trainingSetInput,trainingSetOutput);
% Create Network
numHiddenNeurons = 20; % Adjust as desired
net = newpr(inputs,targets,numHiddenNeurons);
net.divideParam.trainRatio = 75/100; % Adjust as desired
net.divideParam.valRatio = 15/100; % Adjust as desired
net.divideParam.testRatio = 10/100; % Adjust as desired
% Train and Apply Network
[net,tr] = train(net,inputs,targets);
outputs = sim(net,inputs);
% Plot
plotperf(tr)
plotconfusion(targets,outputs)
在开始训练过程之前,我们需要删除 MATLAB 对输入和输出执行的所有预处理和后处理函数。这可以通过在 % Train and Apply Network
行之前添加以下行来完成:
net.inputs{1}.processFcns = {};
net.outputs{2}.processFcns = {};
在对 create_pr_net()
函数进行这些更改后,我们可以简单地使用它来创建我们最终的神经网络:
net = create_pr_net(input, target);
其中 input
和 target
是我们通过 nprtool
导出的值。
通过这种方式,我们可以确定权重的数量等于输入数组的长度。此外,此过程对于简化向其他编程语言的移植也很有用。
B - 实现并使用刚刚用其他编程语言训练的神经网络
通过这些更改,我们可以定义一个这样的函数:
function [ Results ] = classify( net, input )
y1 = tansig(net.IW{1} * input + net.b{1});
Results = tansig(net.LW{2} * y1 + net.b{2});
end
在这段代码中,我们使用了上面提到的 IW 和 LW 数组,还有 biases b,由 nprtool
在网络模式中使用。在这种情况下,我们不关心 role of biases ;简单地说,我们需要使用它们,因为 nprtool
做到了。
现在,我们可以使用上面定义的classify()
函数,或者同样使用sim()
函数,得到相同的结果,如下例所示:
>> sim(net, input(:, 1))
ans =
0.9759
-0.1867
-0.1891
>> classify(net, input(:, 1))
ans =
0.9759
-0.1867
-0.1891
显然,classify()
函数可以解释为伪代码,然后在可能定义 MATLAB tansig()
函数的每种编程语言中实现[2] 以及数组之间的基本操作。
引用资料
[1] Howard Demuth, Mark Beale, Martin Hagan: Neural Network Toolbox 6 - User Guide, MATLAB
[2] Mathworks, tansig - Hyperbolic tangent sigmoid transfer function, MATLAB Documentation center
附加说明
查看 robott's answer和 Sangeun Chi's answer了解更多详情。
关于matlab - 以其他编程语言导出使用 MATLAB 训练的神经网络,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15526112/
是否可以调整此代码以导出foreach循环外的所有行: 这工作正常(内部循环): $vms = Get-VM | Where { $_.State –eq ‘Running’ } | Select-
我试图将我的 bundle.js 引入我的 Node 服务器,但显然 webpack 包在顶部的所有包代码之前缺少一个 module.exports =。 我可以手动将 module.exports
我有一个 android 项目,其中包含一个库项目。在这个库项目中,我包含了许多可绘制对象和动画。 问题是,当我将主项目导出为 .apk 时,它包括所有可绘制对象和动画,甚至是主项目中未使用的对象。
我的一个 mysql 用户以这种方式耗尽了他的生产数据库: 他将所有数据导出到转储文件,然后删除所有内容,然后将数据导入回数据库。他从 Innodb 大表空间中保存了一些 Gig(我不知道他为什么这样
我正在 pimcore 中创建一个新站点。有没有办法导出/导入 pimcore 站点的完整数据,以便我可以导出 xml/csv 格式的 pimcore 数据进行必要的更改,然后将其导入回来? 最佳答案
我有以下静态函数: static inline HandVal StdDeck_StdRules_EVAL_N( StdDeck_CardMask cards, int n
因为我更新了 angular cli 和 nestjs 版本,所以我收到了数百条警告,提示我无法找到我的自定义类型定义和接口(interface)。但是我的nestjs api仍然可以正常工作。 我正
Eclipse 的搜索结果 View 以其树状结构非常方便。有没有办法将这些结果导出为可读的文本格式或将它们保存到文件中以备后用? 我试过使用复制和粘贴,但生成的文本格式远不可读。 最佳答案 不,我认
我想在用户在 Chrome 中打开页面时使用 WebP否则它应该是 png。 我找到了这段代码: var isChrome = !!window.chrome && !!window.chrome.w
您好,我正在尝试根据“上次登录”导出 AD 用户列表 我已经使用基本 powershell 编写了脚本,但是如果有人可以使用“AzureAD 到 Powershell” 命令找到解决方案,我会很感兴趣
有没有办法启用 Stockchart 的导出?我知道这对于普通图表是可行的,但对于股票图表,当尝试启用导出模式时,我得到了未定义, 我尝试过:chart.export.enabled=true;和ch
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,因为
我正在尝试学习如何使用命令行将数据导入/导出到 Oracle。根据我的发现,看起来我应该使用 sqlldr.exe 文件来导入和导出,但我不确定除了 userid 之外还需要什么参数。谁能给我解释一下
您好,我正在尝试根据“上次登录”导出 AD 用户列表 我已经使用基本 powershell 编写了脚本,但是如果有人可以使用“AzureAD 到 Powershell” 命令找到解决方案,我会很感兴趣
我想生成一个 PDF,它将以表格格式显示查询集的输出,例如: query = ModelA.objects.filter(p_id=100) class ModelA(models.Model):
我有一个数据库代理,可以从 IBM Notes 数据生成 Word 文档。我正在使用 Java2Word API 来实现此目的,但不幸的是,该 API 几乎没有文档,而且我找不到任何有关表格格式(大小
我尝试将 Java 程序从 Eclipse 导出到 .jar 文件,但遇到了问题。它运行良好,但由于某种原因它没有找到它应该从中获取数据的文本文件。如果有人能帮忙解决这个问题,我将非常感激。 最佳答案
我正在尝试学习如何使用命令行将数据导入/导出到 Oracle。根据我的发现,看起来我应该使用 sqlldr.exe 文件来导入和导出,但我不确定除了 userid 之外还需要什么参数。谁能给我解释一下
使用LLVM / Clang编译到WebAssembly的默认代码生成将导出内存,并完全忽略表。 使用clang(--target=wasm32-unknown-unknown-wasm)定位Web组
我正在尝试在 HSQL 数据库中重新创建一个 oracle 数据库。 这是为了在本地开发人员系统上进行更好的单元测试。 我需要知道的是,是否有任何我可以在 oracle 服务器/客户端中使用的工具/命
我是一名优秀的程序员,十分优秀!