gpt4 book ai didi

java - 在 mallet 中使用 svmlight 风格的数据和朴素贝叶斯分类器

转载 作者:行者123 更新时间:2023-12-01 14:59:00 33 4
gpt4 key购买 nike

我有几个问题要问
1)在svmlight风格的数据中有(目标特征:值特征:值...)我知道特征是什么,但是目标是什么?这是什么意思?我想知道这一点,因为我计划制作一个文本文件,并将这些数据写入其中。

2)还在一个文件中有多行(目标特征:值特征:值)每一行代表一个文档吗?假设我有 50 个文档,那么每一行代表一个文档?

3) 在我使用存储在其中的 svmlight-style 数据创建此文本文件后,我想将其传递到 MALLET 中的朴素贝叶斯分类器 。这会如何解决呢?

最佳答案

根据 SVMLight 官方网站,训练集由行组成

<line> .=. <target> <feature>:<value> <feature>:<value> ... <feature>:<value> # <info>

其中每行定义如下:

<target> .=. +1 | -1 | 0 | <float> 
<feature> .=. <integer> | "qid"
<value> .=. <float>
<info> .=. <string>

“在分类模式下,目标值表示样本的类别。目标值+1表示正例,-1表示负例。因此,例如,该行

-1 1:0.43 3:0.12 9284:0.2 # abcdef

指定一个反例,其中特征号 1 的值为 0.43,特征号 3 的值为 0.12,特征号 9284 的值为 0.2,所有其他特征的值为 0。此外,存储字符串 abcdef与 vector ,它可以作为为用户定义的内核提供附加信息的一种方式。类标签 0 表示该示例应使用转导进行分类。通过转导分类的示例的预测将写入通过 -l 选项指定的文件中。预测的顺序与训练数据中的顺序相同。 ”

查看官方网站http://svmlight.joachims.org/了解详情。

关于java - 在 mallet 中使用 svmlight 风格的数据和朴素贝叶斯分类器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13959697/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com