gpt4 book ai didi

matlab - 如何在 MATLAB 中实现 svmtrain() 函数的数据?

转载 作者:太空宇宙 更新时间:2023-11-03 20:34:56 26 4
gpt4 key购买 nike

我必须使用 MATLAB 编写一个脚本来对我的数据进行分类。

我的数据包含 1051 个网页(行)和 11000 多个单词(列)。我在每个页面的矩阵中保存单词出现次数。前 230 行是关于计算机科学类(class)的(标记为 +1),其余 821 行不是(标记为 -1)。我将自己标记这些行的一部分(比如 30 行)。然后 SVM 将标记剩余的未标记行。

我发现我可以使用 MATLAB 的 svmtrain() 解决我的问题和 svmclassify()方法。首先我需要创建 SVMStruct .

SVMStruct = svmtrain(Training,Group)

然后我需要使用

Group = svmclassify(SVMStruct,Sample)

但是我不知道是什么意思TrainingGroup是。对于 Group Mathworks说:

Grouping variable, which can be a categorical, numeric, or logical vector, a cell vector of strings, or a character matrix with each row representing a class label. Each element of Group specifies the group of the corresponding row of Training. Group should divide Training into two groups. Group has the same number of elements as there are rows in Training. svmtrain treats each NaN, empty string, or 'undefined' in Group as a missing value, and ignores the corresponding row of Training.

对于 Training据说:

Matrix of training data, where each row corresponds to an observation or replicate, and each column corresponds to a feature or variable. svmtrain treats NaNs or empty strings in Training as missing values and ignores the corresponding rows of Group.

我想知道如何将我的数据应用到 TrainingGroup ?我需要(至少)一些代码示例。

编辑

我不明白的是为了拥有SVMStruct我必须跑

SVMStruct = svmtrain(Training, Group);

为了拥有我必须运行的组

Group = svmclassify(SVMStruct,Sample);

另外我还是没明白是什么Sample应该是怎样的?

我很困惑。

最佳答案

Training 将是一个包含 1051 行(网页/训练实例)和 11000 列(特征/词)的矩阵。我假设您想测试网页上每个单词的存在?在这种情况下,如果给定网页存在该词,则可以将矩阵的条目设置为 1,如果不存在,则设置为 0

您可以使用 Training = zeros(1051,11000); 初始化矩阵,但填充条目将取决于您,大概是用您编写的其他代码完成的。

Group 是一个一维列向量,每个训练实例(网页)都有一个条目,然后告诉您该网页属于两个类中的哪一个。在您的情况下,您会将前 230 个条目设为计算机科学的“+1”,其余 821 个条目设为“-1”,表示不是。

Group = zeros(1051,1);  % gives you a matrix of zeros with 1051 rows and 1 column
Group(1:230) = 1; % set first 230 entries to +1
Group(231:end) = -1; % set the rest to -1

关于matlab - 如何在 MATLAB 中实现 svmtrain() 函数的数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24461363/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com