gpt4 book ai didi

machine-learning - Mahout 用于情感分析

转载 作者:行者123 更新时间:2023-11-30 08:28:39 24 4
gpt4 key购买 nike

使用 mahout 我能够对数据的情绪进行分类。但我陷入了困惑矩阵。

我正在使用 mahout 0.7 朴素贝叶斯算法对推文的情绪进行分类。我使用 trainnbtestnb 朴素贝叶斯分类器来训练分类器,并将推文的情绪分类为“积极”、“消极”或“中性”。

正向训练集示例

      'positive','i love my i phone'
'positive' , it's pleasure to have i phone'

同样我也准备了负样本的训练样本而且是中立的,这是一个巨大的数据集。

我提供的示例测试数据推文不包含情绪。

  'it is nice model'
'simply fantastic '

我能够运行 mahout 分类算法,它会将分类实例的输出作为混淆矩阵给出。

下一步我需要找出哪些推文显示出积极情绪,哪些推文显示出消极情绪。使用分类的预期输出:用情感标记文本。

       'negative','very bad btr life time'
'positive' , 'i phone has excellent design features'

在 mahout 中,我需要实现哪种算法才能获得上述格式的输出。或者需要任何自定义源实现。

为了“友善地”显示数据,请向我建议 apache mahout 提供的算法,这将适合我的 Twitter 数据情感分析。

最佳答案

一般来说,要对某些文本进行分类,您需要使用不同的先验(在您的情况下为正和负)运行朴素贝叶斯,然后选择能产生更大值(value)的一个。

This excerpt Mahout 书中有一些例子。请参见 list 2:

Parameters p = new Parameters();
p.set("basePath", modelDir.getCanonicalPath());9
Datastore ds = new InMemoryBayesDatastore(p);
Algorithm a = new BayesAlgorithm();
ClassifierContext ctx = new ClassifierContext(a,ds);
ctx.initialize();

....

ClassifierResult result = ctx.classifyDocument(tokens, defaultCategory);

这里的结果应该带有“阳性”或“阴性”标签。

关于machine-learning - Mahout 用于情感分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15270145/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com