gpt4 book ai didi

c# - LibSVM 将我所有的训练向量都变成了支持向量,为什么?

转载 作者:太空狗 更新时间:2023-10-29 23:18:18 25 4
gpt4 key购买 nike

我正在尝试使用 SVM 进行新闻文章分类。

我创建了一个表格,其中包含作为行的特征(在文档中找到的唯一词)。我创建了具有这些特征的权重向量映射。即,如果文章中有一个词是特征向量表的一部分,则该位置被标记为 10

例如:- 训练样本生成...

1 1:1 2:1 3:1 4:1 5:1 6:1 7:1 8:1 9:1 10:1 11:1 12:1 13:1 14:1 15:1 16:1 17:1 18:1 19:1 20:1 21:1 22:1 23:1 24:1 25:1 26:1 27:1 28:1 29:1 30:1

由于这是第一份文档,所有功能都已呈现。

我正在使用 10 作为类标签。

我正在使用 svm.Net 进行分类。

我将 300 权重向量手动分类为训练数据,生成的模型将所有向量作为支持向量,这肯定是过度拟合。

我的总特征(特征向量数据库表中的独特的单词/行数)是7610

可能是什么原因?

由于过度拟合,我的项目现在的状态非常糟糕。它将每篇可用的文章分类为正面文章。

LibSVM二元分类对类标签有什么限制吗?

我正在使用 01 而不是 -1+1。这是个问题吗?

最佳答案

您需要进行某种类型的参数搜索,如果类别不平衡,分类器可能会在不做太多事情的情况下人为地获得较高的准确度。这guide is good在教授基本的、实用的东西时,你可能应该读一读

关于c# - LibSVM 将我所有的训练向量都变成了支持向量,为什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5731169/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com