matlab - 为什么神经网络的准确性不好？-6ren

matlab - 为什么神经网络的准确性不好？

转载作者：行者123 更新时间：2023-11-30 09:29:44

24

4

我有一个包含 43 个示例(数据点)和 70'000 个特征的数据集，这意味着我的数据集矩阵为 (43 x 70'000)。标签包含 4 个不同的值 (1-4)，即有 4 个类别。

现在，我已经使用深度置信网络/神经网络进行了分类，但通过留一法交叉验证，我仅获得了 25% 左右的准确率(机会水平)。如果我使用 kNN、SVM 等，我将获得 >80% 的准确率。

我使用了用于 Matlab 的 DeepLearnToolbox ( https://github.com/rasmusbergpalm/DeepLearnToolbox )，并且刚刚改编了工具箱自述文件中的深度置信网络示例。我尝试了不同数量的隐藏层(1-3)和不同数量的隐藏节点(100、500，...)以及不同的学习率、动量等，但准确性仍然很差。特征向量被缩放到范围 [0,1]，因为这是工具箱需要的。

详细来说，我已经完成了以下代码(仅显示一次交叉验证):

% Indices of training and test set
train = training(c,m);
test = ~train;

% Train DBN
opts = [];
dbn = [];
dbn.sizes = [500 500 500];
opts.numepochs =   50;
opts.batchsize = 1;
opts.momentum  = 0.001;
opts.alpha     =   0.15;
dbn = dbnsetup(dbn, feature_vectors_std(train,:), opts);
dbn = dbntrain(dbn, feature_vectors_std(train,:), opts);

%unfold dbn to nn
nn = dbnunfoldtonn(dbn, 4);
nn.activation_function = 'sigm';
nn.learningRate = 0.15;
nn.momentum = 0.001;

%train nn
opts.numepochs =  50;
opts.batchsize = 1;
train_labels = labels(train);
nClass = length(unique(train_labels));
L = zeros(length(train_labels),nClass);
for i = 1:nClass
L(train_labels == i,i) = 1;
end

nn = nntrain(nn, feature_vectors_std(train,:), L, opts);
class = nnpredict(nn, feature_vectors_std(test,:));

feature_vectors_std 是 (43 x 70'000) 矩阵，其值缩放至 [0,1]。

有人能推断出为什么我的准确性这么差吗？

最佳答案

因为你的特征比数据集中的示例多得多。换句话说:你有大量的权重，你需要估计所有的权重，但你不能，因为具有如此巨大结构的神经网络无法在如此小的数据集上很好地泛化，你需要更多的数据来学习如此大量的权重隐藏权重(事实上，神经网络可能会记住你的训练集，但无法推断出它是测试集的“知识”)。同时，SVM 和 kNN 等简单方法的 80% 准确率表明您可以使用更简单的规则来描述数据，因为例如 SVM 将只有 70k 权重(而不是 70kfirst_layer_size + first_layer_size Second_layer_size + ...在NN中)，kNN根本不会使用权重。

复杂模型不是 Elixir ，您尝试拟合的模型越复杂 - 您需要的数据就越多。

关于matlab - 为什么神经网络的准确性不好？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30903589/

24

4

0

文章推荐： java - 在 Java 中使用递归

文章推荐： java - Simple 2.6.7 处理枚举的方式与 Simple 2.6 不同吗？

文章推荐： python - 用于多标签分类的随机森林

c - 为什么回调函数中的值不同 - 不好？
非常简单的应用程序 - 您可以复制 - 粘贴 - 运行。主要只是“创建”应用程序。 - 这不是问题(可能) #include #include #include #include typede
Python len() 不好
关闭。这个问题需要details or clarity .它目前不接受答案。想改进这个问题吗？通过 editing this post 添加细节并澄清问题. 关闭 6 年前。 Improve t
haskell - 为什么 seq 不好？
Haskell 有一个名为 seq 的神奇函数，它接受任何类型的参数并将其简化为弱头范式 (WHNF)。我读过一些资料[但我现在不记得他们是谁了...]，它们声称“多态 seq 很糟糕”。他们在哪些
sql - 为什么在本地服务器上使用 OPENQUERY 不好？
我正在编写一个脚本，该脚本应该在一堆服务器周围运行并从中选择一堆数据，包括本地服务器。选择我需要的数据所需的 SQL 非常复杂，所以我正在编写一种临时 View ，并使用 OPENQUERY 语句来获
scala - 将案例类用于可变状态是否(真的)不好？
考虑以下代码: case class Vector3(var x: Float, var y: Float, var z: Float) { def add(v: Vector3): Unit =
java - 为什么在守护线程上调用 Join 不好
我正在读这个SO post关于守护线程，答案底部的引述是: But joining a demonized thread opens most likely a whole can of troubl
java - 为什么同步 RPC 不好
在阅读有关 Google webtool 工具包的内容时，看到一条声明说“同步 RPC 不好”。他们有什么理由吗？我能想到的一个很好的理由是，对最终用户的响应可能会受到远程服务器延迟或网络问题的影
java - iText - PDF 不好
我有以下 HTML: A Simple Sample Web Page By Sheldon Brown Demonstrating a few HTML feat
java - 输出的第一部分(打印星星)不好
我正在做一项简单的任务，但我陷入困境...... output 我需要使第一行与其他所有内容保持一致，但无论我做什么，它都不想接受空格。那么，我应该纠正什么以及为什么？谢谢 public static
c++ - 解释为什么双用途类(class)不好
我在系统中有一个类，其目的列为“这可以是从午夜算起的秒数。或者带有日期的时间。”我试图解释这有多糟糕，但我无法理解我的观点。有没有人对如何解决这个问题有任何想法。 http://code-slim-j
c++ - 为什么#define 不好？
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: When are C++ macros beneficial? Why is #define bad and
javascript - 为什么有些人认为 JavaScript 不好？
关闭。这个问题是opinion-based .它目前不接受答案。想要改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 关闭 8 年前。 Improve
javascript - 为什么内联 JavaScript 不好？
始终建议通过将所有代码放在 JS 文件中来避免内联 Javascript 代码，该文件包含在所有页面中。我想知道，这是否不会导致繁重的页面出现性能问题。例如，假设我们有几十个这样的函数 functi
javascript - 为什么父组件和子组件之间的双向绑定(bind)不好？
我主要在 AngularJS 中进行开发，最近我正在研究 Vue.js 并阅读它的指南，在它提到的一页上: By default, all props form a one-way-down bind
c# - 什么时候使用 NotSupportedException 不好？
我正在构建一个本地化目录，但遇到了设计难题。现在，目录存储一个 Dictionary存储翻译，其中 IString可以是两种类型:Singular或 Plural .这是 IString 的简化版本:
c++ - 为什么在创建矩阵类时使用 vector 不好？
对于我的矩阵类，我做了: template class Matrix { private: std::array, Height> Elements; stat
c# - 为什么 lock(this) {...} 不好？
MSDN documentation说 public class SomeObject { public void SomeOperation() { lock(this) {
python - 为什么 "import *"不好？
建议不要在 Python 中使用 import *。谁能分享一下原因，这样我下次就可以避免了？最佳答案因为它会将很多东西放入您的命名空间(可能会影响之前导入的一些其他对象，而您不会知道它)。因
pmd - 为什么 System.out.println 不好？
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
language-agnostic - 如何告诉某人他们对我的程序的 mod 不好？
G'day, 这与my question on star developers有关并到 this question regarding telling someone that they're wri

首页

博学

6Ren·AI

商城

matlab - 为什么神经网络的准确性不好？