matlab - Libsvm 分类 MATLAB-6ren

matlab - Libsvm 分类 MATLAB

转载作者：行者123 更新时间：2023-11-30 09:27:34

29

4

我用1~200个数据作为训练数据，201~220个作为测试数据格式如下:3 个类(类 1、类 2、类 3)和 20 个特征

2 1:100 2:96 3:88 4:94 5:96 6:94 7:72 8:68 9:69 10:70 11:76 12:70 13:73 14:71 15:74 16:76 17:78 18:81 19:76 20:76 
2 1:96 2:100 3:88 4:88 5:90 6:98 7:71 8:66 9:63 10:74 11:75 12:66 13:71 14:68 15:74 16:78 17:78 18:85 19:77 20:76 
2 1:88 2:88 3:100 4:96 5:91 6:89 7:70 8:70 9:68 10:74 11:76 12:71 13:73 14:74 15:79 16:77 17:73 18:80 19:78 20:78 
2 1:94 2:87 3:96 4:100 5:92 6:88 7:76 8:73 9:71 10:70 11:74 12:67 13:71 14:71 15:76 16:77 17:71 18:80 19:73 20:73 
2 1:96 2:90 3:91 4:93 5:100 6:92 7:74 8:67 9:67 10:75 11:75 12:67 13:74 14:73 15:77 16:77 17:75 18:82 19:76 20:74 
2 1:93 2:98 3:90 4:88 5:92 6:100 7:73 8:66 9:65 10:73 11:78 12:69 13:73 14:72 15:75 16:74 17:75 18:83 19:79 20:77 
3 1:73 2:71 3:73 4:76 5:74 6:73 7:100 8:79 9:79 10:71 11:65 12:58 13:67 14:73 15:74 16:72 17:60 18:63 19:64 20:60 
3 1:68 2:66 3:70 4:73 5:68 6:67 7:78 8:100 9:85 10:77 11:57 12:57 13:58 14:62 15:68 16:64 17:59 18:57 19:57 20:59 
3 1:69 2:64 3:70 4:72 5:69 6:65 7:78 8:85 9:100 10:70 11:56 12:63 13:62 14:61 15:64 16:69 17:56 18:55 19:55 20:51 
3 1:71 2:74 3:74 4:70 5:76 6:73 7:71 8:73 9:71 10:100 11:58 12:58 13:59 14:60 15:58 16:65 17:57 18:57 19:63 20:57 
1 1:77 2:75 3:76 4:73 5:75 6:79 7:66 8:56 9:56 10:59 11:100 12:77 13:84 14:79 15:82 16:80 17:82 18:82 19:81 20:82 
1 1:70 2:66 3:71 4:67 5:67 6:70 7:63 8:57 9:62 10:58 11:77 12:100 13:84 14:75 15:76 16:78 17:73 18:72 19:87 20:80 
1 1:73 2:72 3:73 4:71 5:74 6:74 7:68 8:58 9:61 10:59 11:84 12:84 13:100 14:86 15:88 16:91 17:81 18:81 19:84 20:86 
1 1:71 2:69 3:75 4:71 5:73 6:73 7:74 8:61 9:61 10:60 11:79 12:75 13:86 14:100 15:90 16:88 17:74 18:79 19:81 20:82 
1 1:74 2:74 3:80 4:76 5:78 6:76 7:73 8:66 9:64 10:59 11:81 12:76 13:88 14:90 15:100 16:93 17:74 18:83 19:81 20:85 
1 1:76 2:77 3:77 4:76 5:78 6:75 7:73 8:64 9:68 10:65 11:80 12:78 13:91 14:88 15:93 16:100 17:79 18:79 19:82 20:83 
1 1:78 2:78 3:73 4:71 5:75 6:75 7:61 8:58 9:57 10:56 11:82 12:73 13:81 14:74 15:74 16:80 17:100 18:85 19:80 20:85 
1 1:81 2:85 3:79 4:80 5:82 6:82 7:63 8:56 9:55 10:57 11:82 12:72 13:81 14:79 15:83 16:79 17:85 18:100 19:83 20:79 
1 1:76 2:77 3:78 4:75 5:76 6:79 7:65 8:57 9:57 10:63 11:81 12:87 13:84 14:81 15:81 16:82 17:80 18:83 19:100 20:87 
1 1:76 2:76 3:78 4:73 5:75 6:78 7:60 8:59 9:51 10:57 11:82 12:80 13:86 14:82 15:85 16:83 17:85 18:79 19:87 20:100

然后，我编写代码对它们进行分类:

% read the data set
[image_label, image_features] = libsvmread(fullfile('D:\...'));
[N D] = size(image_features);

% Determine the train and test index
trainIndex = zeros(N,1); 
trainIndex(1:200) = 1;
testIndex = zeros(N,1); 
testIndex(201:N) = 1;
trainData = image_features(trainIndex==1,:);
trainLabel = image_label(trainIndex==1,:);
testData = image_features(testIndex==1,:);
testLabel = image_label(testIndex==1,:);

% Train the SVM 
model = svmtrain(trainLabel, trainData, '-c 1 -g 0.05 -b 1'); 

% Use the SVM model to classify the data 
[predict_label, accuracy, prob_values] = svmpredict(testLabel, testData, model, '-b 1');

但是predict_label的最终结果都是1类，所以准确率是50%，这意味着它无法得到2类和3类的正确预测标签。数据格式有问题，或者我实现的代码有问题吗？请帮助我，非常感谢。

最佳答案

为了详细说明这个问题，这里至少存在三个问题:

您只需检查参数 C (c) 和 Gamma (g) 的一个值 - SVM 的行为在很大程度上取决于这些参数的正确选择，因此使用 cross validation testing 进行网格搜索是一种常见的方法。用于选择最好的。
数据规模在这里也发挥着重要作用，如果某些维度比其他维度大得多，就会使整个分类器产生偏差，为了处理它，至少有两种基本方法:1.将每个维度线性缩放到某个区间(例如 [0,1] 或 [-1,1])，或者通过 Sigma^(-1/2) 进行变换来标准化数据，其中 Sigma 是数据协方差矩阵
<
标签不平衡 - 当每个类别中的点数完全相同时，SVM 效果最佳。一旦不正确，您应该使用 class weighting scheme以获得有效的结果。

解决这三个问题后，您应该会得到合理的结果。

关于matlab - Libsvm 分类 MATLAB，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19356995/

29

4

0

文章推荐： java - Spring social signin 和 spring security 自定义认证管理器

文章推荐： javascript - Javascript 标准是否保证 ~0 的确定性结果？

文章推荐： javascript - 将整数数组与对象数组进行比较并返回属性

文章推荐： statistics - 贝叶斯统计、机器学习 : prior v. s 超先验

libsvm - LibSVM 特征向量中的特征顺序重要吗？
我正在考虑使用 LibSVM我正在创建所需的特征向量。在几乎所有的示例数据中，特征都有一个顺序，例如: +1 1:3 2:1 3:5 4:2 10:8 想知道这个顺序是否重要，例如: +1 4:2
libsvm - LibSVM 和 scikit-learn 的准确度不同
对于相同的数据集和参数，LibSVM 和 scikit-learn 的 SVM 实现的精度不同，尽管 scikit-learn also uses LibSVM internally 。我忽略了什么
libsvm - 如何为 LIBSVM 和/或 TinySVM 制作训练和测试数据文件
当我打开 LIBSVM 训练数据的示例文件时，我无法理解文件结构。有人可以告诉我如何制作吗？以下是我用于预测歌曲的歌曲作者的训练数据(作为示例): 特征1:歌词中“爱”字的数量特征2:歌词中“ f
libsvm - 如何为 LIBSVM 和/或 TinySVM 制作训练和测试数据文件
当我打开 LIBSVM 训练数据的示例文件时，我无法理解文件结构。有人可以告诉我怎么做吗？下面是我预测歌曲作者的训练数据(作为例子): 特征一:歌词中“爱”字的数量特征2:歌词中“ friend
python - 将训练数据更改为 libsvm 格式以将其传递给 libsvm 中的 grid.py
我是 python 的新手，我正在尝试使用 libsvm。我正在尝试在 grid.py 的帮助下进行交叉验证。我从数据库中获取数据，因此它不是稀疏形式。有什么办法可以按照grid.py中数据格式的要求
apache-spark - 如何将 LIBSVM 模型(使用 LIBSVM 保存)读入 PySpark？
我有一个 LIBSVM 缩放模型(使用 svm-scale 生成)，我想将它移植到 PySpark。我天真地尝试了以下方法: scaler_path = "path to model" a = Min
libsvm - 如何理解LIBLINEAR中的偏置参数？
我不明白LIBLINEAR API中bias参数的含义。为什么在训练时由用户指定？难道它不应该只是从分离超平面到原点的距离，这是学习模型的参数吗？这来自自述文件: struct problem {
libsvm - 分类特征
对于 LibSVM。在'A Practical Guide to Support Vector Classification'中建议使用m数来表示m-category属性。例如 {red, gree
sed - libSVM 自动化标签脚本
是否有任何脚本可以将制表符分隔的数据文件转换为 libSVM 数据格式？例如我未标记的数据: -1 9.45 1.44 8.90 -1 8.12 7.11 8.90-1 8.11 6.12 8.78
svm - libsvm 的结果只支持两个类中的一个类
我的数据有一个奇怪的结果，我想知道您或其他任何人是否对此有任何见解.. 我有大约 5000 个数据和大约 16000 个属性，我用每个类的 2000 个数据(我只有两个类)训练了我的 RBF svm(
libSVM 有/没有概率的不同结果
我想知道为什么 libSVM 在使用或不使用概率进行预测时会给出不同的准确度结果，并且我在 this page 找到了常见问题解答其中说 Q: Why using svm-predict -b 0 a
matlab - LIBSVM - 无概率估计
我正在使用 LIBSVM for matlab。当我使用回归 SVM 时，它输出的概率估计是一个空矩阵，而在使用分类时此功能运行良好。这是正常行为吗，因为在 LIBSVM 自述文件中它说: -b pr
libSVM 有/没有概率的不同结果
我想知道为什么 libSVM 在使用或不使用概率进行预测时会给出不同的准确度结果，并且我在 this page 找到了常见问题解答其中说 Q: Why using svm-predict -b 0 a
读取 libsvm 的训练数据后崩溃
我已经扩展了我的训练数据并尝试进行交叉验证以获得最佳参数，但我不知道该怎么做。我尝试读取缩放后的训练数据并将它们分配给 svm_problem 变量: svm_node My_svm_node[164
使用 LibSVM 进行分类
我正在使用 LibSVM 进行一些多类分类。我使用 LibSVM 的 MATLAB 接口(interface)训练模型。然后，我以 C 语言可以识别的格式保存该模型。现在我想在 C 语言中使用 svm
python - LIBSVM 的多类表示
我的目标是制作一个多类分类器，用于处理不同的文件，这些文件将标记至少两个类(或标签)。这些文件是议会倡议的，因此每个文件都将在同义词库中以至少一对值进行索引。我在Python版本中使用“libsvm
MATLAB LIBSVM 安装
我打算在 MATLAB 中安装 libSVM 并下载了该文件。但是在 MATLAB 中似乎已经有了函数，svmtrain、svmpredict 等等。 MATLAB 是否已附带 LIBSVM？最佳
matlab - Libsvm 模型中支持向量是如何排列的？
我想使用从 Libsvm 模型派生的参数来预测新数据(不是在 matlab 中)。我想问模型中的支持向量(nSV，sv_coef，SVs)是否是按照模型中Label的顺序排列的？下面是使用线性核从fi
matlab - LibSVM 成本权重对于不平衡数据不起作用
我有一个数据集，负标签值的数量是正标签值数量的 163 倍，所以我有一个不平衡的数据集。我已经尝试过了: model = svmtrain(trainLabels, trainFeatures, '-
matlab - LIBSVM 是否处理训练中的缺失值？
我正在使用 libsvm 进行多元回归。我有一些缺失值的数据。例如，我有 10 个实例，每个实例有 10 个节点，每个节点有 10 个与其关联的链接。我需要使用 10 个实例来训练这 10 个节点。但

首页

博学

6Ren·AI

商城

matlab - Libsvm 分类 MATLAB