java - 在 mallet 中使用 svmlight 风格的数据和朴素贝叶斯分类器-6ren

java - 在 mallet 中使用 svmlight 风格的数据和朴素贝叶斯分类器

转载作者：行者123 更新时间：2023-12-01 14:59:00

33

4

我有几个问题要问
1)在svmlight风格的数据中有(目标特征:值特征:值...)我知道特征和值是什么，但是目标是什么？这是什么意思？我想知道这一点，因为我计划制作一个文本文件，并将这些数据写入其中。

2)还在一个文件中有多行(目标特征:值特征:值)每一行代表一个文档吗？假设我有 50 个文档，那么每一行代表一个文档？

3) 在我使用存储在其中的 svmlight-style 数据创建此文本文件后，我想将其传递到 MALLET 中的朴素贝叶斯分类器 。这会如何解决呢？

最佳答案

根据 SVMLight 官方网站，训练集由行组成

<line> .=. <target> <feature>:<value> <feature>:<value> ... <feature>:<value> # <info>

其中每行定义如下:

<target> .=. +1 | -1 | 0 | <float> 
<feature> .=. <integer> | "qid"
<value> .=. <float>
<info> .=. <string>

“在分类模式下，目标值表示样本的类别。目标值+1表示正例，-1表示负例。因此，例如，该行

-1 1:0.43 3:0.12 9284:0.2 # abcdef

指定一个反例，其中特征号 1 的值为 0.43，特征号 3 的值为 0.12，特征号 9284 的值为 0.2，所有其他特征的值为 0。此外，存储字符串 abcdef与 vector ，它可以作为为用户定义的内核提供附加信息的一种方式。类标签 0 表示该示例应使用转导进行分类。通过转导分类的示例的预测将写入通过 -l 选项指定的文件中。预测的顺序与训练数据中的顺序相同。 ”

查看官方网站http://svmlight.joachims.org/了解详情。

关于java - 在 mallet 中使用 svmlight 风格的数据和朴素贝叶斯分类器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13959697/

33

4

0

文章推荐： java - HttpClient 4 的代理设置不起作用

文章推荐： java - 在 HTML 页面上显示 servlet

classification - SVMlight 是否输出分类分数？
我需要知道 SVMlight 是否输出分类分数。我在任何地方都找不到它。我知道例如 libSVM 确实如此。thx 最佳答案 SVMLight 的输出包含每个分类实例的“预测值”。严格来说，这不是“分
python - svmLight Format中的每一项是什么意思
我很困惑每个部分在 svmLight 数据格式中的含义。例如: (标签/目标，[(特征，值)，...]，查询ID) label是数据的排序，queryid是对象的id吗？例如:对于以下项目: 2 q
machine-learning - SVMlight - 寻找权重向量的目的是什么？
SVMlight site (在常见问题解答中)提供了一个计算超车道权重向量的脚本。它说它“计算支持向量的加权和”。这是什么意思？也就是这个脚本是做什么的，这个权重向量的意义和用途是什么？提前致谢
machine-learning - SVMlight 列车数据格式化
我正在尝试使用 svm light 对路透社文本进行分类，但我的训练数据不遵循格式 .=. : : ... : # 其形式为 .=. : : ... : # 目标标签位于单独的文件中。我知道
machine-learning - SVMlight 中的预测文件是什么？
我是 SVMlight 新手。我下载了源代码并编译了SVMlight。我创建了训练和测试数据集。然后跑了 [command] 创建模型文件。使用此模型文件，我运行 svm_classify 创建一个
linux - 为什么 svmlight 中的训练和测试文件相同
我下载了适用于 linux 操作系统的 SVM-Light。运行命令。它会生成 2 个可执行文件 svm_learn 和 svm_classify。使用这个我尝试使用以下代码执行示例文件(它包含 tr
machine-learning - 如何通过 svmlight 中提供的不平衡训练数据集提供平衡训练的成本？
e1071 的 SVM 的成本似乎与 svmlight 的成本不同。 e1071库的手册对其成本参数的定义如下: cost of constraints violation (default: 1)—
machine-learning - 如何通过交叉验证在 svmlight 中获得训练准确性
我想使用 SVMlight 对我的训练集运行交叉验证。似乎这个选项是 -x 1 (尽管我不确定它实现了多少折叠......)。输出为: XiAlpha-estimate of the error: e
opencv - OpenCV HOG 描述符上的 SVMLight
我正在尝试使用 SVM Light 学习 OpenCV2.2 HOG 描述符的分类器。我从 HOG 描述符中得到一个浮点矢量输出。看了SVMLight的文档，还是没明白输入train和test da
python - scikit-learn svmlight 格式加载器中的弃用警告
我在以前从未见过的 IPython 笔记本中收到一条新的弃用警告。我看到的是以下内容: X,y = load_svmlight_file('./GasSensorArray/batch2.dat')
java - 在 mallet 中使用 svmlight 风格的数据和朴素贝叶斯分类器
我有几个问题要问 1)在svmlight风格的数据中有(目标特征:值特征:值...)我知道特征和值是什么，但是目标是什么？这是什么意思？我想知道这一点，因为我计划制作一个文本文件，并将这些数据写入其中
python - Scikit-Learn:加载和转储多标签 SVMlight 格式
在 scikit-learn 中，提供了两个函数来加载和转储 SVM^light 格式的文件: sklearn.datasets.load_svmlight_file 和 sklearn.datase
以 svmlight 格式导出 numpy/列表的 python 程序
有什么方法可以将 python 数组导出为 SVM light 格式？最佳答案 scikit-learn 中有一个: http://scikit-learn.org/stable/modules/g
python-2.7 - Python Svmlight 错误 : DeprecationWarning: using a non-integer number instead of an integer will result in an error in the future
我在 Mac OSX Mountain Lion 上使用 scikit_learn-0.14 运行 python 2.7.5。但是，我运行 svmlight 命令的所有操作都会收到以下警告: Dep

首页

博学

6Ren·AI

商城

java - 在 mallet 中使用 svmlight 风格的数据和朴素贝叶斯分类器